documentation/reference/conjugate__gradient_8h_source.html

//   OpenNN: Open Neural Networks Library

//   www.opennn.net

//

//   C O N J U G A T E   G R A D I E N T   C L A S S   H E A D E R

//

//   Artificial Intelligence Techniques SL

//   artelnics@artelnics.com


#ifndef CONJUGATEGRADIENT_H

#define CONJUGATEGRADIENT_H


// System inlcludes


#include <string>

#include <sstream>

#include <iostream>

#include <fstream>

#include <algorithm>

#include <functional>

#include <climits>

#include <cmath>

#include <ctime>


// OpenNN includes


#include "config.h"

#include "loss_index.h"

#include "optimization_algorithm.h"

#include "learning_rate_algorithm.h"


namespace OpenNN

{


struct ConjugateGradientData;


class ConjugateGradient : public OptimizationAlgorithm

{


public:


   // Enumerations


   enum class TrainingDirectionMethod{PR, FR};


   // DEFAULT CONSTRUCTOR


   explicit ConjugateGradient();


   explicit ConjugateGradient(LossIndex*);


   virtual ~ConjugateGradient();


   // Get methods


   const LearningRateAlgorithm& get_learning_rate_algorithm() const;

   LearningRateAlgorithm* get_learning_rate_algorithm_pointer();


   // Training operators


   const TrainingDirectionMethod& get_training_direction_method() const;

   string write_training_direction_method() const;


   // Stopping criteria


   const type& get_minimum_loss_decrease() const;

   const type& get_loss_goal() const;

   const Index& get_maximum_selection_failures() const;


   const Index& get_maximum_epochs_number() const;

   const type& get_maximum_time() const;


   // Set methods


   void set_default();


   void set_loss_index_pointer(LossIndex*);


   // Training operators


   void set_training_direction_method(const TrainingDirectionMethod&);

   void set_training_direction_method(const string&);


   // Stopping criteria


   void set_loss_goal(const type&);

   void set_minimum_loss_decrease(const type&);

   void set_maximum_selection_failures(const Index&);


   void set_maximum_epochs_number(const Index&);

   void set_maximum_time(const type&);


   // Utilities


   void set_save_period(const Index&);


   // Training direction methods


   type calculate_PR_parameter(const Tensor<type, 1>&, const Tensor<type, 1>&) const;

   type calculate_FR_parameter(const Tensor<type, 1>&, const Tensor<type, 1>&) const;


   void calculate_PR_training_direction(const Tensor<type, 1>&, const Tensor<type, 1>&, const Tensor<type, 1>&, Tensor<type, 1>&) const;

   void calculate_FR_training_direction(const Tensor<type, 1>&, const Tensor<type, 1>&, const Tensor<type, 1>&, Tensor<type, 1>&) const;


   void calculate_gradient_descent_training_direction(const Tensor<type, 1>&, Tensor<type, 1>&) const;


   void calculate_conjugate_gradient_training_direction(const Tensor<type, 1>&,

                                                        const Tensor<type, 1>&,

                                                        const Tensor<type, 1>&,

                                                        Tensor<type, 1>&) const;


   // Training methods


   TrainingResults perform_training();


   string write_optimization_algorithm_type() const;


   // Serialization methods


   Tensor<string, 2> to_string_matrix() const;


   void from_XML(const tinyxml2::XMLDocument&);


   void write_XML(tinyxml2::XMLPrinter&) const;


   void update_parameters(

           const DataSetBatch& batch,

           NeuralNetworkForwardPropagation& forward_propagation,

           LossIndexBackPropagation& back_propagation,

           ConjugateGradientData& optimization_data);


private:


   type first_learning_rate = static_cast<type>(0.01);


   TrainingDirectionMethod training_direction_method = ConjugateGradient::TrainingDirectionMethod::FR;


   LearningRateAlgorithm learning_rate_algorithm;


   // Stopping criteria


   type minimum_loss_decrease = type(0);


   type training_loss_goal = type(0);


   Index maximum_selection_failures;


   Index maximum_epochs_number;


   type maximum_time;

};


struct ConjugateGradientData : public OptimizationAlgorithmData

{


    explicit ConjugateGradientData();


    explicit ConjugateGradientData(ConjugateGradient*);


    virtual ~ConjugateGradientData();


    void set(ConjugateGradient*);


    void print() const;


    ConjugateGradient* conjugate_gradient_pointer = nullptr;


    Tensor<type, 1> parameters_increment;


    Tensor<type, 1> old_gradient;


    Tensor<type, 1> old_training_direction;


    Index epoch = 0;


    type learning_rate = type(0);

    type old_learning_rate = type(0);


    Tensor<type, 0> training_slope;

};


}


#endif


// OpenNN: Open Neural Networks Library.

// Copyright(C) 2005-2021 Artificial Intelligence Techniques, SL.

//

// This library is free software; you can redistribute it and/or

// modify it under the terms of the GNU Lesser General Public

// License as published by the Free Software Foundation; either

// version 2.1 of the License, or any later version.

//

// This library is distributed in the hope that it will be useful,

// but WITHOUT ANY WARRANTY; without even the implied warranty of

// MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU

// Lesser General Public License for more details.


// You should have received a copy of the GNU Lesser General Public

// License along with this library; if not, write to the Free Software

// Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA

OpenNN::ConjugateGradient
Definition: conjugate_gradient.h:46

OpenNN::ConjugateGradient::perform_training
TrainingResults perform_training()
Definition: conjugate_gradient.cpp:715

OpenNN::ConjugateGradient::set_maximum_selection_failures
void set_maximum_selection_failures(const Index &)
Definition: conjugate_gradient.cpp:257

OpenNN::ConjugateGradient::calculate_FR_training_direction
void calculate_FR_training_direction(const Tensor< type, 1 > &, const Tensor< type, 1 > &, const Tensor< type, 1 > &, Tensor< type, 1 > &) const
Definition: conjugate_gradient.cpp:561

OpenNN::ConjugateGradient::set_loss_index_pointer
void set_loss_index_pointer(LossIndex *)
Definition: conjugate_gradient.cpp:133

OpenNN::ConjugateGradient::get_maximum_time
const type & get_maximum_time() const
Returns the maximum training time.
Definition: conjugate_gradient.cpp:123

OpenNN::ConjugateGradient::ConjugateGradient
ConjugateGradient()
Definition: conjugate_gradient.cpp:19

OpenNN::ConjugateGradient::get_loss_goal
const type & get_loss_goal() const
Definition: conjugate_gradient.cpp:99

OpenNN::ConjugateGradient::from_XML
void from_XML(const tinyxml2::XMLDocument &)
Definition: conjugate_gradient.cpp:1086

OpenNN::ConjugateGradient::set_default
void set_default()
Definition: conjugate_gradient.cpp:216

OpenNN::ConjugateGradient::get_maximum_epochs_number
const Index & get_maximum_epochs_number() const
Returns the maximum number of epochs for training.
Definition: conjugate_gradient.cpp:115

OpenNN::ConjugateGradient::to_string_matrix
Tensor< string, 2 > to_string_matrix() const
Writes as matrix of strings the most representative atributes.
Definition: conjugate_gradient.cpp:933

OpenNN::ConjugateGradient::minimum_loss_decrease
type minimum_loss_decrease
Minimum loss improvement between two successive iterations. It is used as a stopping criterion.
Definition: conjugate_gradient.h:164

OpenNN::ConjugateGradient::get_learning_rate_algorithm_pointer
LearningRateAlgorithm * get_learning_rate_algorithm_pointer()
Returns a pointer to the learning rate algorithm object inside the conjugate gradient method object.
Definition: conjugate_gradient.cpp:57

OpenNN::ConjugateGradient::calculate_conjugate_gradient_training_direction
void calculate_conjugate_gradient_training_direction(const Tensor< type, 1 > &, const Tensor< type, 1 > &, const Tensor< type, 1 > &, Tensor< type, 1 > &) const
Definition: conjugate_gradient.cpp:641

OpenNN::ConjugateGradient::write_optimization_algorithm_type
string write_optimization_algorithm_type() const
Write a string with best algorithm type for the model.
Definition: conjugate_gradient.cpp:925

OpenNN::ConjugateGradient::get_learning_rate_algorithm
const LearningRateAlgorithm & get_learning_rate_algorithm() const
Returns a constant reference to the learning rate algorithm object inside the conjugate gradient meth...
Definition: conjugate_gradient.cpp:49

OpenNN::ConjugateGradient::set_save_period
void set_save_period(const Index &)
Definition: conjugate_gradient.cpp:302

OpenNN::ConjugateGradient::set_maximum_time
void set_maximum_time(const type &)
Definition: conjugate_gradient.cpp:275

OpenNN::ConjugateGradient::learning_rate_algorithm
LearningRateAlgorithm learning_rate_algorithm
Learning rate algorithm object for one-dimensional minimization.
Definition: conjugate_gradient.h:158

OpenNN::ConjugateGradient::set_loss_goal
void set_loss_goal(const type &)
Definition: conjugate_gradient.cpp:248

OpenNN::ConjugateGradient::calculate_PR_parameter
type calculate_PR_parameter(const Tensor< type, 1 > &, const Tensor< type, 1 > &) const
Definition: conjugate_gradient.cpp:409

OpenNN::ConjugateGradient::set_training_direction_method
void set_training_direction_method(const TrainingDirectionMethod &)
Definition: conjugate_gradient.cpp:145

OpenNN::ConjugateGradient::maximum_time
type maximum_time
Maximum training time. It is used as a stopping criterion.
Definition: conjugate_gradient.h:181

OpenNN::ConjugateGradient::set_maximum_epochs_number
void set_maximum_epochs_number(const Index &)
Definition: conjugate_gradient.cpp:266

OpenNN::ConjugateGradient::set_minimum_loss_decrease
void set_minimum_loss_decrease(const type &)
Definition: conjugate_gradient.cpp:238

OpenNN::ConjugateGradient::TrainingDirectionMethod
TrainingDirectionMethod
Enumeration of the available training operators for obtaining the training direction.
Definition: conjugate_gradient.h:54

OpenNN::ConjugateGradient::~ConjugateGradient
virtual ~ConjugateGradient()
Destructor.
Definition: conjugate_gradient.cpp:42

OpenNN::ConjugateGradient::calculate_FR_parameter
type calculate_FR_parameter(const Tensor< type, 1 > &, const Tensor< type, 1 > &) const
Definition: conjugate_gradient.cpp:327

OpenNN::ConjugateGradient::training_loss_goal
type training_loss_goal
Goal value for the loss. It is used as a stopping criterion.
Definition: conjugate_gradient.h:168

OpenNN::ConjugateGradient::maximum_epochs_number
Index maximum_epochs_number
Maximum number of epochs to perform_training. It is used as a stopping criterion.
Definition: conjugate_gradient.h:177

OpenNN::ConjugateGradient::write_XML
void write_XML(tinyxml2::XMLPrinter &) const
Definition: conjugate_gradient.cpp:984

OpenNN::ConjugateGradient::get_maximum_selection_failures
const Index & get_maximum_selection_failures() const
Returns the maximum number of selection error increases during the training process.
Definition: conjugate_gradient.cpp:107

OpenNN::ConjugateGradient::maximum_selection_failures
Index maximum_selection_failures
Definition: conjugate_gradient.h:173

OpenNN::ConjugateGradient::calculate_PR_training_direction
void calculate_PR_training_direction(const Tensor< type, 1 > &, const Tensor< type, 1 > &, const Tensor< type, 1 > &, Tensor< type, 1 > &) const
Definition: conjugate_gradient.cpp:492

OpenNN::ConjugateGradient::write_training_direction_method
string write_training_direction_method() const
Returns a string with the name of the training direction.
Definition: conjugate_gradient.cpp:73

OpenNN::ConjugateGradient::training_direction_method
TrainingDirectionMethod training_direction_method
Applied method for calculating the conjugate gradient direction.
Definition: conjugate_gradient.h:154

OpenNN::ConjugateGradient::update_parameters
void update_parameters(const DataSetBatch &batch, NeuralNetworkForwardPropagation &forward_propagation, LossIndexBackPropagation &back_propagation, ConjugateGradientData &optimization_data)
ConjugateGradient::update_parameters.
Definition: conjugate_gradient.cpp:1335

OpenNN::ConjugateGradient::get_training_direction_method
const TrainingDirectionMethod & get_training_direction_method() const
Returns the conjugate gradient training direction method used for training.
Definition: conjugate_gradient.cpp:65

OpenNN::ConjugateGradient::get_minimum_loss_decrease
const type & get_minimum_loss_decrease() const
Returns the minimum loss improvement during training.
Definition: conjugate_gradient.cpp:90

OpenNN::LearningRateAlgorithm
A learning rate that is adjusted according to an algorithm during training to minimize training time.
Definition: learning_rate_algorithm.h:41

OpenNN::LossIndex
This abstract class represents the concept of loss index composed of an error term and a regularizati...
Definition: loss_index.h:48

OpenNN::OptimizationAlgorithm
Definition: optimization_algorithm.h:42

tinyxml2::XMLDocument
Definition: tinyxml2.h:1653

tinyxml2::XMLPrinter
Definition: tinyxml2.h:2154

OpenNN::ConjugateGradientData
Definition: conjugate_gradient.h:186

OpenNN::ConjugateGradientData::ConjugateGradientData
ConjugateGradientData()
Default constructor.
Definition: conjugate_gradient.cpp:1431

OpenNN::DataSetBatch
Definition: data_set.h:887

OpenNN::LossIndexBackPropagation
Definition: loss_index.h:290

OpenNN::NeuralNetworkForwardPropagation
Definition: neural_network.h:262

OpenNN::OptimizationAlgorithmData
Definition: optimization_algorithm.h:168

OpenNN::TrainingResults
This structure contains the optimization algorithm results.
Definition: optimization_algorithm.h:198