documentation/reference/gradient__descent_8h_source.html

//   OpenNN: Open Neural Networks Library

//   www.opennn.net

//

//   G R A D I E N T   D E S C E N T   C L A S S   H E A D E R

//

//   Artificial Intelligence Techniques SL

//   artelnics@artelnics.com


#ifndef GRADIENTDESCENT_H

#define GRADIENTDESCENT_H


// System includes


#include <string>

#include <sstream>

#include <iostream>

#include <fstream>

#include <algorithm>

#include <functional>

#include <limits>

#include <limits.h>

#include <cmath>

#include <ctime>


// OpenNN includes


#include "loss_index.h"


#include "optimization_algorithm.h"

#include "learning_rate_algorithm.h"

#include "config.h"


namespace OpenNN

{


struct GradientDescentData;


class GradientDescent : public OptimizationAlgorithm

{


public:


   // Constructors


   explicit GradientDescent();


   explicit GradientDescent(LossIndex*);


   // Destructor


   virtual ~GradientDescent();


   const LearningRateAlgorithm& get_learning_rate_algorithm() const;

   LearningRateAlgorithm* get_learning_rate_algorithm_pointer();


   string get_hardware_use() const;


   // Stopping criteria


   const type& get_minimum_loss_decrease() const;

   const type& get_loss_goal() const;


   const Index& get_maximum_selection_failures() const;


   const Index& get_maximum_epochs_number() const;

   const type& get_maximum_time() const;


   // Set methods


   void set_loss_index_pointer(LossIndex*);


   void set_learning_rate_algorithm(const LearningRateAlgorithm&);


   void set_default();


   // Stopping criteria


   void set_maximum_epochs_number(const Index&);


   void set_minimum_loss_decrease(const type&);

   void set_loss_goal(const type&);


   void set_maximum_selection_failures(const Index&);


   void set_maximum_time(const type&);


   // Training methods


   void calculate_training_direction(const Tensor<type, 1>&, Tensor<type, 1>&) const;


   void update_parameters(

           const DataSetBatch& batch,

           NeuralNetworkForwardPropagation& forward_propagation,

           LossIndexBackPropagation& back_propagation,

           GradientDescentData& optimization_data);


   TrainingResults perform_training();


   string write_optimization_algorithm_type() const;


   // Serialization methods


   Tensor<string, 2> to_string_matrix() const;


   void from_XML(const tinyxml2::XMLDocument&);


   void write_XML(tinyxml2::XMLPrinter&) const;


private:


   // TRAINING OPERATORS


   LearningRateAlgorithm learning_rate_algorithm;


   const type first_learning_rate = static_cast<type>(0.01);


   // Stopping criteria


   type minimum_loss_decrease;


   type training_loss_goal;


   Index maximum_selection_failures;


   Index maximum_epochs_number;


   type maximum_time;


};


struct GradientDescentData : public OptimizationAlgorithmData

{


    explicit GradientDescentData()

    {

    }


    explicit GradientDescentData(GradientDescent* new_gradient_descent_pointer)

    {

        set(new_gradient_descent_pointer);

    }


    virtual ~GradientDescentData() {}


    void set(GradientDescent* new_gradient_descent_pointer)

    {

        gradient_descent_pointer = new_gradient_descent_pointer;


        LossIndex* loss_index_pointer = gradient_descent_pointer->get_loss_index_pointer();


        NeuralNetwork* neural_network_pointer = loss_index_pointer->get_neural_network_pointer();


        const Index parameters_number = neural_network_pointer->get_parameters_number();


        // Neural network data


        potential_parameters.resize(parameters_number);


        parameters_increment.resize(parameters_number);


        // Optimization algorithm data


        training_direction.resize(parameters_number);

    }


    void print() const

    {

        cout << "Training direction:" << endl;

        cout << training_direction << endl;


        cout << "Learning rate:" << endl;

        cout << learning_rate << endl;

    }


    GradientDescent* gradient_descent_pointer = nullptr;


    // Neural network data


    Tensor<type, 1> parameters_increment;


    // Optimization algorithm data


    Index epoch = 0;


    Tensor<type, 0> training_slope;


    type learning_rate = type(0);

    type old_learning_rate = type(0);

};


}


#endif

OpenNN::GradientDescent
Definition: gradient_descent.h:48

OpenNN::GradientDescent::perform_training
TrainingResults perform_training()
Definition: gradient_descent.cpp:341

OpenNN::GradientDescent::set_maximum_selection_failures
void set_maximum_selection_failures(const Index &)
Definition: gradient_descent.cpp:188

OpenNN::GradientDescent::set_loss_index_pointer
void set_loss_index_pointer(LossIndex *)
Definition: gradient_descent.cpp:115

OpenNN::GradientDescent::get_maximum_time
const type & get_maximum_time() const
Returns the maximum training time.
Definition: gradient_descent.cpp:105

OpenNN::GradientDescent::get_hardware_use
string get_hardware_use() const
Returns the hardware used. Default: Multi-core.
Definition: gradient_descent.cpp:64

OpenNN::GradientDescent::get_loss_goal
const type & get_loss_goal() const
Definition: gradient_descent.cpp:81

OpenNN::GradientDescent::from_XML
void from_XML(const tinyxml2::XMLDocument &)
Definition: gradient_descent.cpp:690

OpenNN::GradientDescent::set_default
void set_default()
Sets the members of the optimization algorithm object to their default values.
Definition: gradient_descent.cpp:123

OpenNN::GradientDescent::get_maximum_epochs_number
const Index & get_maximum_epochs_number() const
Returns the maximum number of iterations for training.
Definition: gradient_descent.cpp:97

OpenNN::GradientDescent::to_string_matrix
Tensor< string, 2 > to_string_matrix() const
Writes as matrix of strings the most representative atributes.
Definition: gradient_descent.cpp:563

OpenNN::GradientDescent::minimum_loss_decrease
type minimum_loss_decrease
Minimum loss improvement between two successive iterations. It is used as a stopping criterion.
Definition: gradient_descent.h:134

OpenNN::GradientDescent::get_learning_rate_algorithm_pointer
LearningRateAlgorithm * get_learning_rate_algorithm_pointer()
Returns a pointer to the learning rate algorithm object inside the gradient descent object.
Definition: gradient_descent.cpp:56

OpenNN::GradientDescent::GradientDescent
GradientDescent()
Definition: gradient_descent.cpp:18

OpenNN::GradientDescent::get_learning_rate_algorithm
const LearningRateAlgorithm & get_learning_rate_algorithm() const
Returns a constant reference to the learning rate algorithm object inside the gradient descent object...
Definition: gradient_descent.cpp:48

OpenNN::GradientDescent::set_maximum_time
void set_maximum_time(const type &)
Definition: gradient_descent.cpp:197

OpenNN::GradientDescent::learning_rate_algorithm
LearningRateAlgorithm learning_rate_algorithm
Learning rate algorithm object for one-dimensional minimization.
Definition: gradient_descent.h:126

OpenNN::GradientDescent::set_loss_goal
void set_loss_goal(const type &)
Definition: gradient_descent.cpp:178

OpenNN::GradientDescent::maximum_time
type maximum_time
Maximum training time. It is used as a stopping criterion.
Definition: gradient_descent.h:151

OpenNN::GradientDescent::set_maximum_epochs_number
void set_maximum_epochs_number(const Index &)
Definition: gradient_descent.cpp:144

OpenNN::GradientDescent::calculate_training_direction
void calculate_training_direction(const Tensor< type, 1 > &, Tensor< type, 1 > &) const
Definition: gradient_descent.cpp:224

OpenNN::GradientDescent::set_minimum_loss_decrease
void set_minimum_loss_decrease(const type &)
Definition: gradient_descent.cpp:168

OpenNN::GradientDescent::training_loss_goal
type training_loss_goal
Goal value for the loss. It is used as a stopping criterion.
Definition: gradient_descent.h:138

OpenNN::GradientDescent::maximum_epochs_number
Index maximum_epochs_number
Maximum epochs number.
Definition: gradient_descent.h:147

OpenNN::GradientDescent::~GradientDescent
virtual ~GradientDescent()
Destructor.
Definition: gradient_descent.cpp:41

OpenNN::GradientDescent::write_XML
void write_XML(tinyxml2::XMLPrinter &) const
Definition: gradient_descent.cpp:610

OpenNN::GradientDescent::update_parameters
void update_parameters(const DataSetBatch &batch, NeuralNetworkForwardPropagation &forward_propagation, LossIndexBackPropagation &back_propagation, GradientDescentData &optimization_data)
GradientDescent::update_parameters.
Definition: gradient_descent.cpp:267

OpenNN::GradientDescent::get_maximum_selection_failures
const Index & get_maximum_selection_failures() const
Returns the maximum number of selection error increases during the training process.
Definition: gradient_descent.cpp:89

OpenNN::GradientDescent::maximum_selection_failures
Index maximum_selection_failures
Definition: gradient_descent.h:143

OpenNN::GradientDescent::get_minimum_loss_decrease
const type & get_minimum_loss_decrease() const
Returns the minimum loss improvement during training.
Definition: gradient_descent.cpp:72

OpenNN::LearningRateAlgorithm
A learning rate that is adjusted according to an algorithm during training to minimize training time.
Definition: learning_rate_algorithm.h:41

OpenNN::LossIndex
This abstract class represents the concept of loss index composed of an error term and a regularizati...
Definition: loss_index.h:48

OpenNN::LossIndex::get_neural_network_pointer
NeuralNetwork * get_neural_network_pointer() const
Returns a pointer to the neural network object associated to the error term.
Definition: loss_index.h:70

OpenNN::NeuralNetwork
Definition: neural_network.h:47

OpenNN::NeuralNetwork::get_parameters_number
Index get_parameters_number() const
Definition: neural_network.cpp:1044

OpenNN::OptimizationAlgorithm
Definition: optimization_algorithm.h:42

OpenNN::OptimizationAlgorithm::get_loss_index_pointer
LossIndex * get_loss_index_pointer() const
Definition: optimization_algorithm.cpp:54

tinyxml2::XMLDocument
Definition: tinyxml2.h:1653

tinyxml2::XMLPrinter
Definition: tinyxml2.h:2154

OpenNN::DataSetBatch
Definition: data_set.h:887

OpenNN::GradientDescentData
Definition: gradient_descent.h:157

OpenNN::GradientDescentData::~GradientDescentData
virtual ~GradientDescentData()
Destructor.
Definition: gradient_descent.h:172

OpenNN::GradientDescentData::GradientDescentData
GradientDescentData()
Default constructor.
Definition: gradient_descent.h:160

OpenNN::LossIndexBackPropagation
Definition: loss_index.h:290

OpenNN::NeuralNetworkForwardPropagation
Definition: neural_network.h:262

OpenNN::OptimizationAlgorithmData
Definition: optimization_algorithm.h:168

OpenNN::TrainingResults
This structure contains the optimization algorithm results.
Definition: optimization_algorithm.h:198