documentation/reference/gradient__descent_8cpp_source.html

//   OpenNN: Open Neural Networks Library

//   www.opennn.net

//

//   G R A D I E N T   D E S C E N T   C L A S S

//

//   Artificial Intelligence Techniques SL

//   artelnics@artelnics.com


#include "gradient_descent.h"


namespace OpenNN

{


GradientDescent::GradientDescent()

    : OptimizationAlgorithm()

{

    set_default();

}


GradientDescent::GradientDescent(LossIndex* new_loss_index_pointer)

    : OptimizationAlgorithm(new_loss_index_pointer)

{

    learning_rate_algorithm.set_loss_index_pointer(new_loss_index_pointer);


    set_default();

}


GradientDescent::~GradientDescent()

{

}


const LearningRateAlgorithm& GradientDescent::get_learning_rate_algorithm() const

{

    return learning_rate_algorithm;

}


LearningRateAlgorithm* GradientDescent::get_learning_rate_algorithm_pointer()

{

    return &learning_rate_algorithm;

}


string GradientDescent::get_hardware_use() const

{

    return hardware_use;

}


const type& GradientDescent::get_minimum_loss_decrease() const

{

    return minimum_loss_decrease;

}


const type& GradientDescent::get_loss_goal() const

{

    return training_loss_goal;

}


const Index& GradientDescent::get_maximum_selection_failures() const

{

    return maximum_selection_failures;

}


const Index& GradientDescent::get_maximum_epochs_number() const

{

    return maximum_epochs_number;

}


const type& GradientDescent::get_maximum_time() const

{

    return maximum_time;

}


void GradientDescent::set_loss_index_pointer(LossIndex* new_loss_index_pointer)

{

    loss_index_pointer = new_loss_index_pointer;


    learning_rate_algorithm.set_loss_index_pointer(new_loss_index_pointer);

}


void GradientDescent::set_default()

{

    // Stopping criteria


    minimum_loss_decrease = type(0);


    training_loss_goal = type(0);

    maximum_selection_failures = numeric_limits<Index>::max();


    maximum_epochs_number = 1000;

    maximum_time = type(3600);


    // UTILITIES


    display_period = 10;

}


void GradientDescent::set_maximum_epochs_number(const Index& new_maximum_epochs_number)

{

#ifdef OPENNN_DEBUG


    if(new_maximum_epochs_number < static_cast<type>(0.0))

    {

        ostringstream buffer;


        buffer << "OpenNN Exception: GradientDescent class.\n"

               << "void set_maximum_epochs_number(const type&) method.\n"

               << "Maximum epochs number must be equal or greater than 0.\n";


        throw logic_error(buffer.str());

    }


#endif


    maximum_epochs_number = new_maximum_epochs_number;

}


void GradientDescent::set_minimum_loss_decrease(const type& new_minimum_loss_decrease)

{

    minimum_loss_decrease = new_minimum_loss_decrease;

}


void GradientDescent::set_loss_goal(const type& new_loss_goal)

{

    training_loss_goal = new_loss_goal;

}


void GradientDescent::set_maximum_selection_failures(const Index& new_maximum_selection_failures)

{

    maximum_selection_failures = new_maximum_selection_failures;

}


void GradientDescent::set_maximum_time(const type& new_maximum_time)

{

#ifdef OPENNN_DEBUG


    if(new_maximum_time < static_cast<type>(0.0))

    {

        ostringstream buffer;


        buffer << "OpenNN Exception: GradientDescent class.\n"

               << "void set_maximum_time(const type&) method.\n"

               << "Maximum time must be equal or greater than 0.\n";


        throw logic_error(buffer.str());

    }


#endif


    // Set maximum time


    maximum_time = new_maximum_time;

}


void GradientDescent::calculate_training_direction(const Tensor<type, 1>& gradient, Tensor<type, 1>& training_direction) const

{

#ifdef OPENNN_DEBUG


    ostringstream buffer;


    if(!loss_index_pointer)

    {

        buffer << "OpenNN Exception: GradientDescent class.\n"

               << "Tensor<type, 1> calculate_training_direction(const Tensor<type, 1>&) const method.\n"

               << "Loss index pointer is nullptr.\n";


        throw logic_error(buffer.str());

    }


    const NeuralNetwork* neural_network_pointer = loss_index_pointer->get_neural_network_pointer();


    const Index parameters_number = neural_network_pointer->get_parameters_number();


    const Index gradient_size = gradient.size();


    if(gradient_size != parameters_number)

    {

        buffer << "OpenNN Exception: GradientDescent class.\n"

               << "Tensor<type, 1> calculate_training_direction(const Tensor<type, 1>&) const method.\n"

               << "Size of gradient(" << gradient_size

               << ") is not equal to number of parameters(" << parameters_number << ").\n";


        throw logic_error(buffer.str());

    }


#endif


    training_direction.device(*thread_pool_device) = -gradient;

}


void GradientDescent::update_parameters(

        const DataSetBatch& batch,

        NeuralNetworkForwardPropagation& forward_propagation,

        LossIndexBackPropagation& back_propagation,

        GradientDescentData& optimization_data)

{

    calculate_training_direction(back_propagation.gradient, optimization_data.training_direction);


    if(is_zero(optimization_data.training_direction)) return;

        //throw logic_error("Training direction is zero");


    // Get initial learning_rate


    optimization_data.epoch == 0

            ? optimization_data.initial_learning_rate = first_learning_rate

            : optimization_data.initial_learning_rate = optimization_data.old_learning_rate;


    const pair<type,type> directional_point = learning_rate_algorithm.calculate_directional_point(

                            batch,

                            forward_propagation,

                            back_propagation,

                            optimization_data);


    optimization_data.learning_rate = directional_point.first;

    back_propagation.loss = directional_point.second;


    if(abs(optimization_data.learning_rate) > type(0))

    {

        optimization_data.parameters_increment.device(*thread_pool_device)

                = optimization_data.training_direction*optimization_data.learning_rate;


        back_propagation.parameters.device(*thread_pool_device) += optimization_data.parameters_increment;

    }

    else

    {

        const Index parameters_number = back_propagation.parameters.size();


        for(Index i = 0; i < parameters_number; i++)

        {

            if(abs(back_propagation.gradient(i)) < type(NUMERIC_LIMITS_MIN))

            {

                optimization_data.parameters_increment(i) = type(0);

            }

            else if(back_propagation.gradient(i) > type(0))

            {

                back_propagation.parameters(i) -= numeric_limits<type>::epsilon();


                optimization_data.parameters_increment(i) = -numeric_limits<type>::epsilon();

            }

            else if(back_propagation.gradient(i) < type(0))

            {

                back_propagation.parameters(i) += numeric_limits<type>::epsilon();


                optimization_data.parameters_increment(i) = numeric_limits<type>::epsilon();

            }

        }


        optimization_data.learning_rate = optimization_data.old_learning_rate;

    }


    // Update parameters


    optimization_data.old_learning_rate = optimization_data.learning_rate;


    forward_propagation.neural_network_pointer->set_parameters(back_propagation.parameters);


}


TrainingResults GradientDescent::perform_training()

{

    TrainingResults results(maximum_epochs_number+1);


#ifdef OPENNN_DEBUG

    check();

#endif


    // Start training


    if(display) cout << "Training with gradient descent...\n";


    // Data set


    DataSet* data_set_pointer = loss_index_pointer->get_data_set_pointer();


    const Index training_samples_number = data_set_pointer->get_training_samples_number();

    const Index selection_samples_number = data_set_pointer->get_selection_samples_number();


    const bool has_selection = data_set_pointer->has_selection();


    const Tensor<Index, 1> training_samples_indices = data_set_pointer->get_training_samples_indices();

    const Tensor<Index, 1> selection_samples_indices = data_set_pointer->get_selection_samples_indices();


    const Tensor<Index, 1> input_variables_indices = data_set_pointer->get_input_variables_indices();

    const Tensor<Index, 1> target_variables_indices = data_set_pointer->get_target_variables_indices();


    const Tensor<string, 1> inputs_names = data_set_pointer->get_input_variables_names();

    const Tensor<string, 1> targets_names = data_set_pointer->get_target_variables_names();


    const Tensor<Scaler, 1> input_variables_scalers = data_set_pointer->get_input_variables_scalers();

    const Tensor<Scaler, 1> target_variables_scalers = data_set_pointer->get_target_variables_scalers();


    const Tensor<Descriptives, 1> input_variables_descriptives = data_set_pointer->scale_input_variables();

    Tensor<Descriptives, 1> target_variables_descriptives;


    // Neural network


    NeuralNetwork* neural_network_pointer = loss_index_pointer->get_neural_network_pointer();


    neural_network_pointer->set_inputs_names(inputs_names);

    neural_network_pointer->set_outputs_names(targets_names);


    if(neural_network_pointer->has_scaling_layer())

    {

        ScalingLayer* scaling_layer_pointer = neural_network_pointer->get_scaling_layer_pointer();

        scaling_layer_pointer->set(input_variables_descriptives, input_variables_scalers);

    }


    if(neural_network_pointer->has_unscaling_layer())

    {

        target_variables_descriptives = data_set_pointer->scale_target_variables();


        UnscalingLayer* unscaling_layer_pointer = neural_network_pointer->get_unscaling_layer_pointer();

        unscaling_layer_pointer->set(target_variables_descriptives, target_variables_scalers);

    }


    NeuralNetworkForwardPropagation training_forward_propagation(training_samples_number, neural_network_pointer);

    NeuralNetworkForwardPropagation selection_forward_propagation(selection_samples_number, neural_network_pointer);


    DataSetBatch training_batch(training_samples_number, data_set_pointer);

    training_batch.fill(training_samples_indices, input_variables_indices, target_variables_indices);


    DataSetBatch selection_batch(selection_samples_number, data_set_pointer);

    selection_batch.fill(selection_samples_indices, input_variables_indices, target_variables_indices);


    // Loss index


    const string error_type = loss_index_pointer->get_error_type();


    loss_index_pointer->set_normalization_coefficient();


    LossIndexBackPropagation training_back_propagation(training_samples_number, loss_index_pointer);

    LossIndexBackPropagation selection_back_propagation(selection_samples_number, loss_index_pointer);


    // Optimization algorithm


    GradientDescentData optimization_data(this);


    Index selection_failures = 0;


    bool stop_training = false;


    type old_loss = type(0);

    type loss_decrease = numeric_limits<type>::max();


    // Main loop


    time_t beginning_time, current_time;

    time(&beginning_time);

    type elapsed_time = type(0);


    for(Index epoch = 0; epoch <= maximum_epochs_number; epoch++)

    {

        if(display && epoch%display_period == 0) cout << "Epoch: " << epoch << endl;


        optimization_data.epoch = epoch;


        // Neural network


        neural_network_pointer->forward_propagate(training_batch, training_forward_propagation);


        // Loss index


        loss_index_pointer->back_propagate(training_batch, training_forward_propagation, training_back_propagation);

        results.training_error_history(epoch) = training_back_propagation.error;


        if(has_selection)

        {

            neural_network_pointer->forward_propagate(selection_batch, selection_forward_propagation);


            loss_index_pointer->calculate_errors(selection_batch, selection_forward_propagation, selection_back_propagation);

            loss_index_pointer->calculate_error(selection_batch, selection_forward_propagation, selection_back_propagation);


            results.selection_error_history(epoch) = selection_back_propagation.error;


            if(epoch != 0 && results.selection_error_history(epoch) > results.selection_error_history(epoch-1)) selection_failures++;

        }


        // Optimization algorithm


        time(&current_time);

        elapsed_time = static_cast<type>(difftime(current_time, beginning_time));


        // Print progress


        if(display && epoch%display_period == 0)

        {

            cout << "Training error: " << training_back_propagation.error << endl;

            if(has_selection) cout << "Selection error: " << selection_back_propagation.error << endl;

            cout << "Learning rate: " << optimization_data.learning_rate << endl;

            cout << "Elapsed time: " << write_time(elapsed_time) << endl;

        }


        // Stopping Criteria


        if(training_back_propagation.loss <= training_loss_goal)

        {

            if(display)

                cout << "Epoch " << epoch << endl << "Loss goal reached: " << training_back_propagation.loss << endl;


            stop_training = true;


            results.stopping_condition = StoppingCondition::LossGoal;

        }


        else if(selection_failures >= maximum_selection_failures)

        {

            if(display) cout << "Epoch " << epoch << endl << "Maximum selection failures reached: " << selection_failures << endl;


            stop_training = true;


            results.stopping_condition = StoppingCondition::MaximumSelectionErrorIncreases;

        }


        else if(epoch == maximum_epochs_number)

        {

            if(display) cout << "Epoch " << epoch << endl << "Maximum number of epochs reached: " << epoch << endl;


            stop_training = true;


            results.stopping_condition = StoppingCondition::MaximumEpochsNumber;

        }


        else if(elapsed_time >= maximum_time)

        {

            if(display) cout << "Epoch " << epoch << endl << "Maximum training time reached: " << elapsed_time;


            stop_training = true;


            results.stopping_condition = StoppingCondition::MaximumTime;

        }


        if(epoch != 0) loss_decrease = old_loss - training_back_propagation.loss;


        if(loss_decrease < minimum_loss_decrease)

        {

            if(display) cout << "Epoch " << epoch << endl << "Minimum loss decrease reached: " << loss_decrease << endl;


            stop_training = true;


            results.stopping_condition = StoppingCondition::MinimumLossDecrease;

        }


        old_loss = training_back_propagation.loss;


        if(stop_training)

        {

            results.resize_training_error_history(epoch+1);


            if(has_selection) results.resize_selection_error_history(epoch+1);

            else results.resize_selection_error_history(0);


            results.elapsed_time = write_time(elapsed_time);


            break;

        }


        if(epoch != 0 && epoch%save_period == 0) neural_network_pointer->save(neural_network_file_name);


        update_parameters(training_batch, training_forward_propagation, training_back_propagation, optimization_data);

    }


    data_set_pointer->unscale_input_variables(input_variables_descriptives);


    if(neural_network_pointer->has_unscaling_layer())

        data_set_pointer->unscale_target_variables(target_variables_descriptives);


    if(display) results.print();


    return results;

}


string GradientDescent::write_optimization_algorithm_type() const

{

    return "GRADIENT_DESCENT";

}


Tensor<string, 2> GradientDescent::to_string_matrix() const

{

    Tensor<string, 2> labels_values(7, 2);


    // Learning rate method


    labels_values(0,0) = "Learning rate method";

    labels_values(0,1) = learning_rate_algorithm.write_learning_rate_method();


    // Loss tolerance


    labels_values(1,0) = "Learning rate tolerance";

    labels_values(1,1) = to_string(double(learning_rate_algorithm.get_learning_rate_tolerance()));


    // Minimum loss decrease


    labels_values(2,0) = "Minimum loss decrease";

    labels_values(2,1) = to_string(double(minimum_loss_decrease));


    // Loss goal


    labels_values(3,0) = "Loss goal";

    labels_values(3,1) = to_string(double(training_loss_goal));


    // Maximum selection error increases


    labels_values(4,0) = "Maximum selection error increases";

    labels_values(4,1) = to_string(maximum_selection_failures);


    // Maximum epochs number


    labels_values(5,0) = "Maximum epochs number";

    labels_values(5,1) = to_string(maximum_epochs_number);


    // Maximum time


    labels_values(6,0) = "Maximum time";

    labels_values(6,1) = write_time(maximum_time);


    return labels_values;

}


void GradientDescent::write_XML(tinyxml2::XMLPrinter& file_stream) const

{

    ostringstream buffer;


    // Learning rate algorithm


    file_stream.OpenElement("GradientDescent");


    learning_rate_algorithm.write_XML(file_stream);


    // Minimum loss decrease


    file_stream.OpenElement("MinimumLossDecrease");


    buffer.str("");

    buffer << minimum_loss_decrease;


    file_stream.PushText(buffer.str().c_str());


    file_stream.CloseElement();


    // Loss goal


    file_stream.OpenElement("LossGoal");


    buffer.str("");

    buffer << training_loss_goal;


    file_stream.PushText(buffer.str().c_str());


    file_stream.CloseElement();


    // Maximum selection error increases


    file_stream.OpenElement("MaximumSelectionErrorIncreases");


    buffer.str("");

    buffer << maximum_selection_failures;


    file_stream.PushText(buffer.str().c_str());


    file_stream.CloseElement();


    // Maximum epochs number


    file_stream.OpenElement("MaximumEpochsNumber");


    buffer.str("");

    buffer << maximum_epochs_number;


    file_stream.PushText(buffer.str().c_str());


    file_stream.CloseElement();


    // Maximum time


    file_stream.OpenElement("MaximumTime");


    buffer.str("");

    buffer << maximum_time;


    file_stream.PushText(buffer.str().c_str());


    file_stream.CloseElement();


    // Hardware use


    file_stream.OpenElement("HardwareUse");


    buffer.str("");

    buffer << hardware_use;


    file_stream.PushText(buffer.str().c_str());


    file_stream.CloseElement();


    file_stream.CloseElement();

}


void GradientDescent::from_XML(const tinyxml2::XMLDocument& document)

{

    const tinyxml2::XMLElement* root_element = document.FirstChildElement("GradientDescent");


    if(!root_element)

    {

        ostringstream buffer;


        buffer << "OpenNN Exception: GradientDescent class.\n"

               << "void from_XML(const tinyxml2::XMLDocument&) method.\n"

               << "Gradient descent element is nullptr.\n";


        throw logic_error(buffer.str());

    }


    // Learning rate algorithm

    {

        const tinyxml2::XMLElement* learning_rate_algorithm_element

                = root_element->FirstChildElement("LearningRateAlgorithm");


        if(learning_rate_algorithm_element)

        {

            tinyxml2::XMLDocument learning_rate_algorithm_document;

            tinyxml2::XMLNode* element_clone;


            element_clone = learning_rate_algorithm_element->DeepClone(&learning_rate_algorithm_document);


            learning_rate_algorithm_document.InsertFirstChild(element_clone);


            learning_rate_algorithm.from_XML(learning_rate_algorithm_document);

        }

    }


    // Minimum loss decrease

    {

        const tinyxml2::XMLElement* element = root_element->FirstChildElement("MinimumLossDecrease");


        if(element)

        {

            cout << "MinimumLossDecrease" << endl;

            const type new_minimum_loss_decrease = static_cast<type>(atof(element->GetText()));


            try

            {

                set_minimum_loss_decrease(new_minimum_loss_decrease);

            }

            catch(const logic_error& e)

            {

                cerr << e.what() << endl;

            }

        }

    }


    // Loss goal

    {

        const tinyxml2::XMLElement* element = root_element->FirstChildElement("LossGoal");


        if(element)

        {

            const type new_loss_goal = static_cast<type>(atof(element->GetText()));


            try

            {

                set_loss_goal(new_loss_goal);

            }

            catch(const logic_error& e)

            {

                cerr << e.what() << endl;

            }

        }

    }


    // Maximum selection error increases

    {

        const tinyxml2::XMLElement* element = root_element->FirstChildElement("MaximumSelectionErrorIncreases");


        if(element)

        {

            const Index new_maximum_selection_failures = static_cast<Index>(atoi(element->GetText()));


            try

            {

                set_maximum_selection_failures(new_maximum_selection_failures);

            }

            catch(const logic_error& e)

            {

                cerr << e.what() << endl;

            }

        }

    }


    // Maximum epochs number

    {

        const tinyxml2::XMLElement* element = root_element->FirstChildElement("MaximumEpochsNumber");


        if(element)

        {

            const Index new_maximum_epochs_number = static_cast<Index>(atoi(element->GetText()));


            try

            {

                set_maximum_epochs_number(new_maximum_epochs_number);

            }

            catch(const logic_error& e)

            {

                cerr << e.what() << endl;

            }

        }

    }


    // Maximum time

    {

        const tinyxml2::XMLElement* element = root_element->FirstChildElement("MaximumTime");


        if(element)

        {

            const type new_maximum_time = static_cast<type>(atof(element->GetText()));


            try

            {

                set_maximum_time(new_maximum_time);

            }

            catch(const logic_error& e)

            {

                cerr << e.what() << endl;

            }

        }

    }


    // Hardware use

    {

        const tinyxml2::XMLElement* element = root_element->FirstChildElement("HardwareUse");


        if(element)

        {

            const string new_hardware_use = element->GetText();

            try

            {

                set_hardware_use(new_hardware_use);

            }

            catch(const logic_error& e)

            {

                cerr << e.what() << endl;

            }

        }

    }

}


}


// OpenNN: Open Neural Networks Library.

// Copyright(C) 2005-2021 Artificial Intelligence Techniques, SL.

//

// This library is free software; you can redistribute it and/or

// modify it under the terms of the GNU Lesser General Public

// License as published by the Free Software Foundation; either

// version 2.1 of the License, or any later version.

//

// This library is distributed in the hope that it will be useful,

// but WITHOUT ANY WARRANTY; without even the implied warranty of

// MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU

// Lesser General Public License for more details.


// You should have received a copy of the GNU Lesser General Public

// License along with this library; if not, write to the Free Software

// Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA

OpenNN::DataSet
This class represents the concept of data set for data modelling problems, such as approximation,...
Definition: data_set.h:57

OpenNN::DataSet::get_training_samples_number
Index get_training_samples_number() const
Returns the number of samples in the data set which will be used for training.
Definition: data_set.cpp:1382

OpenNN::DataSet::scale_target_variables
Tensor< Descriptives, 1 > scale_target_variables()
Definition: data_set.cpp:6298

OpenNN::DataSet::get_training_samples_indices
Tensor< Index, 1 > get_training_samples_indices() const
Returns the indices of the samples which will be used for training.
Definition: data_set.cpp:1073

OpenNN::DataSet::get_selection_samples_indices
Tensor< Index, 1 > get_selection_samples_indices() const
Returns the indices of the samples which will be used for selection.
Definition: data_set.cpp:1098

OpenNN::DataSet::unscale_input_variables
void unscale_input_variables(const Tensor< Descriptives, 1 > &)
Definition: data_set.cpp:6351

OpenNN::DataSet::get_target_variables_indices
Tensor< Index, 1 > get_target_variables_indices() const
Returns the indices of the target variables.
Definition: data_set.cpp:3094

OpenNN::DataSet::get_selection_samples_number
Index get_selection_samples_number() const
Returns the number of samples in the data set which will be used for selection.
Definition: data_set.cpp:1402

OpenNN::DataSet::unscale_target_variables
void unscale_target_variables(const Tensor< Descriptives, 1 > &)
Definition: data_set.cpp:6397

OpenNN::DataSet::get_target_variables_names
Tensor< string, 1 > get_target_variables_names() const
Definition: data_set.cpp:2215

OpenNN::DataSet::get_input_variables_indices
Tensor< Index, 1 > get_input_variables_indices() const
Returns the indices of the input variables.
Definition: data_set.cpp:3047

OpenNN::DataSet::get_input_variables_names
Tensor< string, 1 > get_input_variables_names() const
Definition: data_set.cpp:2184

OpenNN::DataSet::scale_input_variables
Tensor< Descriptives, 1 > scale_input_variables()
Definition: data_set.cpp:6243

OpenNN::GradientDescent::perform_training
TrainingResults perform_training()
Definition: gradient_descent.cpp:341

OpenNN::GradientDescent::set_maximum_selection_failures
void set_maximum_selection_failures(const Index &)
Definition: gradient_descent.cpp:188

OpenNN::GradientDescent::set_loss_index_pointer
void set_loss_index_pointer(LossIndex *)
Definition: gradient_descent.cpp:115

OpenNN::GradientDescent::get_maximum_time
const type & get_maximum_time() const
Returns the maximum training time.
Definition: gradient_descent.cpp:105

OpenNN::GradientDescent::get_hardware_use
string get_hardware_use() const
Returns the hardware used. Default: Multi-core.
Definition: gradient_descent.cpp:64

OpenNN::GradientDescent::get_loss_goal
const type & get_loss_goal() const
Definition: gradient_descent.cpp:81

OpenNN::GradientDescent::from_XML
void from_XML(const tinyxml2::XMLDocument &)
Definition: gradient_descent.cpp:690

OpenNN::GradientDescent::set_default
void set_default()
Sets the members of the optimization algorithm object to their default values.
Definition: gradient_descent.cpp:123

OpenNN::GradientDescent::get_maximum_epochs_number
const Index & get_maximum_epochs_number() const
Returns the maximum number of iterations for training.
Definition: gradient_descent.cpp:97

OpenNN::GradientDescent::to_string_matrix
Tensor< string, 2 > to_string_matrix() const
Writes as matrix of strings the most representative atributes.
Definition: gradient_descent.cpp:563

OpenNN::GradientDescent::minimum_loss_decrease
type minimum_loss_decrease
Minimum loss improvement between two successive iterations. It is used as a stopping criterion.
Definition: gradient_descent.h:134

OpenNN::GradientDescent::get_learning_rate_algorithm_pointer
LearningRateAlgorithm * get_learning_rate_algorithm_pointer()
Returns a pointer to the learning rate algorithm object inside the gradient descent object.
Definition: gradient_descent.cpp:56

OpenNN::GradientDescent::GradientDescent
GradientDescent()
Definition: gradient_descent.cpp:18

OpenNN::GradientDescent::get_learning_rate_algorithm
const LearningRateAlgorithm & get_learning_rate_algorithm() const
Returns a constant reference to the learning rate algorithm object inside the gradient descent object...
Definition: gradient_descent.cpp:48

OpenNN::GradientDescent::set_maximum_time
void set_maximum_time(const type &)
Definition: gradient_descent.cpp:197

OpenNN::GradientDescent::learning_rate_algorithm
LearningRateAlgorithm learning_rate_algorithm
Learning rate algorithm object for one-dimensional minimization.
Definition: gradient_descent.h:126

OpenNN::GradientDescent::set_loss_goal
void set_loss_goal(const type &)
Definition: gradient_descent.cpp:178

OpenNN::GradientDescent::maximum_time
type maximum_time
Maximum training time. It is used as a stopping criterion.
Definition: gradient_descent.h:151

OpenNN::GradientDescent::set_maximum_epochs_number
void set_maximum_epochs_number(const Index &)
Definition: gradient_descent.cpp:144

OpenNN::GradientDescent::calculate_training_direction
void calculate_training_direction(const Tensor< type, 1 > &, Tensor< type, 1 > &) const
Definition: gradient_descent.cpp:224

OpenNN::GradientDescent::set_minimum_loss_decrease
void set_minimum_loss_decrease(const type &)
Definition: gradient_descent.cpp:168

OpenNN::GradientDescent::training_loss_goal
type training_loss_goal
Goal value for the loss. It is used as a stopping criterion.
Definition: gradient_descent.h:138

OpenNN::GradientDescent::maximum_epochs_number
Index maximum_epochs_number
Maximum epochs number.
Definition: gradient_descent.h:147

OpenNN::GradientDescent::~GradientDescent
virtual ~GradientDescent()
Destructor.
Definition: gradient_descent.cpp:41

OpenNN::GradientDescent::write_XML
void write_XML(tinyxml2::XMLPrinter &) const
Definition: gradient_descent.cpp:610

OpenNN::GradientDescent::update_parameters
void update_parameters(const DataSetBatch &batch, NeuralNetworkForwardPropagation &forward_propagation, LossIndexBackPropagation &back_propagation, GradientDescentData &optimization_data)
GradientDescent::update_parameters.
Definition: gradient_descent.cpp:267

OpenNN::GradientDescent::get_maximum_selection_failures
const Index & get_maximum_selection_failures() const
Returns the maximum number of selection error increases during the training process.
Definition: gradient_descent.cpp:89

OpenNN::GradientDescent::maximum_selection_failures
Index maximum_selection_failures
Definition: gradient_descent.h:143

OpenNN::GradientDescent::get_minimum_loss_decrease
const type & get_minimum_loss_decrease() const
Returns the minimum loss improvement during training.
Definition: gradient_descent.cpp:72

OpenNN::LearningRateAlgorithm
A learning rate that is adjusted according to an algorithm during training to minimize training time.
Definition: learning_rate_algorithm.h:41

OpenNN::LearningRateAlgorithm::set_loss_index_pointer
void set_loss_index_pointer(LossIndex *)
Definition: learning_rate_algorithm.cpp:175

OpenNN::LearningRateAlgorithm::from_XML
void from_XML(const tinyxml2::XMLDocument &)
Definition: learning_rate_algorithm.cpp:730

OpenNN::LearningRateAlgorithm::write_learning_rate_method
string write_learning_rate_method() const
Returns a string with the name of the learning rate method to be used.
Definition: learning_rate_algorithm.cpp:97

OpenNN::LearningRateAlgorithm::calculate_directional_point
pair< type, type > calculate_directional_point(const DataSetBatch &, NeuralNetworkForwardPropagation &, LossIndexBackPropagation &, OptimizationAlgorithmData &) const
Definition: learning_rate_algorithm.cpp:268

OpenNN::LearningRateAlgorithm::write_XML
void write_XML(tinyxml2::XMLPrinter &) const
Definition: learning_rate_algorithm.cpp:693

OpenNN::LossIndex
This abstract class represents the concept of loss index composed of an error term and a regularizati...
Definition: loss_index.h:48

OpenNN::LossIndex::get_error_type
virtual string get_error_type() const
Returns a string with the default type of error term, "USER_PERFORMANCE_TERM".
Definition: loss_index.cpp:608

OpenNN::LossIndex::get_neural_network_pointer
NeuralNetwork * get_neural_network_pointer() const
Returns a pointer to the neural network object associated to the error term.
Definition: loss_index.h:70

OpenNN::LossIndex::get_data_set_pointer
DataSet * get_data_set_pointer() const
Returns a pointer to the data set object associated to the error term.
Definition: loss_index.h:92

OpenNN::NeuralNetwork
Definition: neural_network.h:47

OpenNN::NeuralNetwork::get_scaling_layer_pointer
ScalingLayer * get_scaling_layer_pointer() const
Returns a pointer to the scaling layers object composing this neural network object.
Definition: neural_network.cpp:473

OpenNN::NeuralNetwork::has_scaling_layer
bool has_scaling_layer() const
Definition: neural_network.cpp:221

OpenNN::NeuralNetwork::has_unscaling_layer
bool has_unscaling_layer() const
Definition: neural_network.cpp:285

OpenNN::NeuralNetwork::forward_propagate
void forward_propagate(const DataSetBatch &, NeuralNetworkForwardPropagation &) const
Calculate forward propagation in neural network.
Definition: neural_network.cpp:1373

OpenNN::NeuralNetwork::save
void save(const string &) const
Definition: neural_network.cpp:2371

OpenNN::NeuralNetwork::set_parameters
void set_parameters(Tensor< type, 1 > &)
Definition: neural_network.cpp:1135

OpenNN::NeuralNetwork::get_unscaling_layer_pointer
UnscalingLayer * get_unscaling_layer_pointer() const
Returns a pointer to the unscaling layers object composing this neural network object.
Definition: neural_network.cpp:497

OpenNN::NeuralNetwork::set_inputs_names
void set_inputs_names(const Tensor< string, 1 > &)
Definition: neural_network.cpp:796

OpenNN::NeuralNetwork::get_parameters_number
Index get_parameters_number() const
Definition: neural_network.cpp:1044

OpenNN::NeuralNetwork::set_outputs_names
void set_outputs_names(const Tensor< string, 1 > &)
Definition: neural_network.cpp:805

OpenNN::OptimizationAlgorithm
Definition: optimization_algorithm.h:42

OpenNN::OptimizationAlgorithm::neural_network_file_name
string neural_network_file_name
Path where the neural network is saved.
Definition: optimization_algorithm.h:150

OpenNN::OptimizationAlgorithm::set_hardware_use
void set_hardware_use(const string &)
Set hardware to use. Default: Multi-core.
Definition: optimization_algorithm.cpp:85

OpenNN::OptimizationAlgorithm::loss_index_pointer
LossIndex * loss_index_pointer
Pointer to a loss index for a neural network object.
Definition: optimization_algorithm.h:128

OpenNN::OptimizationAlgorithm::check
virtual void check() const
Definition: optimization_algorithm.cpp:260

OpenNN::OptimizationAlgorithm::display
bool display
Display messages to screen.
Definition: optimization_algorithm.h:154

OpenNN::OptimizationAlgorithm::write_time
const string write_time(const type &) const
Writes the time from seconds in format HH:mm:ss.
Definition: optimization_algorithm.cpp:483

OpenNN::OptimizationAlgorithm::save_period
Index save_period
Number of iterations between the training saving progress.
Definition: optimization_algorithm.h:146

OpenNN::OptimizationAlgorithm::hardware_use
string hardware_use
Hardware use.
Definition: optimization_algorithm.h:138

OpenNN::OptimizationAlgorithm::display_period
Index display_period
Number of iterations between the training showing progress.
Definition: optimization_algorithm.h:142

OpenNN::ScalingLayer
This class represents a layer of scaling neurons.
Definition: scaling_layer.h:38

OpenNN::ScalingLayer::set
void set()
Sets the scaling layer to be empty.
Definition: scaling_layer.cpp:290

OpenNN::UnscalingLayer
This class represents a layer of unscaling neurons.
Definition: unscaling_layer.h:40

OpenNN::UnscalingLayer::set
void set()
Sets the unscaling layer to be empty.
Definition: unscaling_layer.cpp:273

tinyxml2::XMLDocument
Definition: tinyxml2.h:1653

tinyxml2::XMLElement
Definition: tinyxml2.h:1243

tinyxml2::XMLNode
Definition: tinyxml2.h:663

tinyxml2::XMLPrinter
Definition: tinyxml2.h:2154

tinyxml2::XMLPrinter::PushText
void PushText(const char *text, bool cdata=false)
Add a text node.
Definition: tinyxml2.cpp:2878

tinyxml2::XMLPrinter::CloseElement
virtual void CloseElement(bool compactMode=false)
If streaming, close the Element.
Definition: tinyxml2.cpp:2834

half_float::abs
HALF_CONSTEXPR half abs(half arg)
Definition: half.hpp:2735

OpenNN::DataSetBatch
Definition: data_set.h:887

OpenNN::GradientDescentData
Definition: gradient_descent.h:157

OpenNN::LossIndexBackPropagation
Definition: loss_index.h:290

OpenNN::NeuralNetworkForwardPropagation
Definition: neural_network.h:262

OpenNN::TrainingResults
This structure contains the optimization algorithm results.
Definition: optimization_algorithm.h:198

OpenNN::TrainingResults::selection_error_history
Tensor< type, 1 > selection_error_history
History of the selection error over the training iterations.
Definition: optimization_algorithm.h:279

OpenNN::TrainingResults::resize_training_error_history
void resize_training_error_history(const Index &)
Resizes the training error history keeping the values.
Definition: optimization_algorithm.cpp:438

OpenNN::TrainingResults::stopping_condition
OptimizationAlgorithm::StoppingCondition stopping_condition
Stopping condition of the algorithm.
Definition: optimization_algorithm.h:257

OpenNN::TrainingResults::resize_selection_error_history
void resize_selection_error_history(const Index &)
Resizes the selection error history keeping the values.
Definition: optimization_algorithm.cpp:461

OpenNN::TrainingResults::training_error_history
Tensor< type, 1 > training_error_history
History of the loss function loss over the training iterations.
Definition: optimization_algorithm.h:275

OpenNN::TrainingResults::elapsed_time
string elapsed_time
Elapsed time of the training process.
Definition: optimization_algorithm.h:283