documentation/reference/adaptive__moment__estimation_8h_source.html

//   OpenNN: Open Neural Networks Library

//   www.opennn.net

//

//   A D A P T I V E   M O M E N T   E S T I M A T I O N

//

//   Artificial Intelligence Techniques SL

//   artelnics@artelnics.com


#ifndef ADAPTIVEMOMENTESTIMATION_H

#define ADAPTIVEMOMENTESTIMATION_H


// System includes


#include <string>

#include <sstream>

#include <iostream>

#include <fstream>

#include <algorithm>

#include <functional>

#include <limits>

#include <cmath>

#include <ctime>

#include <chrono>

#include <time.h>

#include <iostream>

#include <ctime>

#include <ratio>

#include <chrono>


// OpenNN includes


#include "loss_index.h"

#include "optimization_algorithm.h"

#include "config.h"


namespace OpenNN

{


struct AdaptiveMomentEstimationData;


class AdaptiveMomentEstimation : public OptimizationAlgorithm

{


public:


   // Constructors


   explicit AdaptiveMomentEstimation();


   explicit AdaptiveMomentEstimation(LossIndex*);


   virtual ~AdaptiveMomentEstimation();


   // Training operators


   const type& get_initial_learning_rate() const;

   const type& get_beta_1() const;

   const type& get_beta_2() const;

   const type& get_epsilon() const;


   // Stopping criteria


   const type& get_loss_goal() const;

   const type& get_maximum_time() const;


   // Set methods


   void set_loss_index_pointer(LossIndex*);


   void set_batch_samples_number(const Index& new_batch_samples_number);


   void set_default();


   // Get methods


   Index get_batch_samples_number() const;


   // Training operators


   void set_initial_learning_rate(const type&);

   void set_beta_1(const type&);

   void set_beta_2(const type&);

   void set_epsilon(const type&);


   // Training parameters


   void set_maximum_epochs_number(const Index&);


   // Stopping criteria


   void set_loss_goal(const type&);

   void set_maximum_time(const type&);


   // Training methods


   TrainingResults perform_training();


   string write_optimization_algorithm_type() const;


   // Serialization methods


   Tensor<string, 2> to_string_matrix() const;


   void from_XML(const tinyxml2::XMLDocument&);


   void write_XML(tinyxml2::XMLPrinter&) const;


   void update_parameters(LossIndexBackPropagation& ,

                         AdaptiveMomentEstimationData&);


private:


   // TRAINING OPERATORS


   type initial_learning_rate = static_cast<type>(0.001);


   type initial_decay = type(0);


   type beta_1 = static_cast<type>(0.9);


   type beta_2 = static_cast<type>(0.999);


   type epsilon =static_cast<type>(1.e-7);


    // Stopping criteria


   type training_loss_goal = type(0);


   Index maximum_epochs_number = 10000;


   Index maximum_selection_failures = numeric_limits<Index>::max();


   type maximum_time = type(3600);


   Index batch_samples_number = 1000;


#ifdef OPENNN_CUDA

    #include "../../opennn-cuda/opennn-cuda/adaptive_moment_estimation_cuda.h"

#endif


};


struct AdaptiveMomentEstimationData : public OptimizationAlgorithmData

{


    explicit AdaptiveMomentEstimationData();


    explicit AdaptiveMomentEstimationData(AdaptiveMomentEstimation*);


    virtual ~AdaptiveMomentEstimationData();


    void set(AdaptiveMomentEstimation*);


    void print() const;


    AdaptiveMomentEstimation* adaptive_moment_estimation_pointer = nullptr;


    Index learning_rate_iteration = 0;


    Tensor<type, 1> gradient_exponential_decay;

    Tensor<type, 1> square_gradient_exponential_decay;


    Index iteration;

};


}


#endif

OpenNN::AdaptiveMomentEstimation
Definition: adaptive_moment_estimation.h:53

OpenNN::AdaptiveMomentEstimation::perform_training
TrainingResults perform_training()
Definition: adaptive_moment_estimation.cpp:206

OpenNN::AdaptiveMomentEstimation::get_epsilon
const type & get_epsilon() const
Returns epsilon.
Definition: adaptive_moment_estimation.cpp:70

OpenNN::AdaptiveMomentEstimation::set_loss_index_pointer
void set_loss_index_pointer(LossIndex *)
Definition: adaptive_moment_estimation.cpp:97

OpenNN::AdaptiveMomentEstimation::get_maximum_time
const type & get_maximum_time() const
Returns the maximum training time.
Definition: adaptive_moment_estimation.cpp:87

OpenNN::AdaptiveMomentEstimation::get_beta_2
const type & get_beta_2() const
Returns beta 2.
Definition: adaptive_moment_estimation.cpp:62

OpenNN::AdaptiveMomentEstimation::get_loss_goal
const type & get_loss_goal() const
Definition: adaptive_moment_estimation.cpp:79

OpenNN::AdaptiveMomentEstimation::from_XML
void from_XML(const tinyxml2::XMLDocument &)
Definition: adaptive_moment_estimation.cpp:595

OpenNN::AdaptiveMomentEstimation::set_default
void set_default()
Sets the members of the optimization algorithm object to their default values.
Definition: adaptive_moment_estimation.cpp:714

OpenNN::AdaptiveMomentEstimation::AdaptiveMomentEstimation
AdaptiveMomentEstimation()
Definition: adaptive_moment_estimation.cpp:18

OpenNN::AdaptiveMomentEstimation::initial_learning_rate
type initial_learning_rate
Initial learning rate.
Definition: adaptive_moment_estimation.h:130

OpenNN::AdaptiveMomentEstimation::get_beta_1
const type & get_beta_1() const
Returns beta 1.
Definition: adaptive_moment_estimation.cpp:54

OpenNN::AdaptiveMomentEstimation::set_epsilon
void set_epsilon(const type &)
Definition: adaptive_moment_estimation.cpp:133

OpenNN::AdaptiveMomentEstimation::to_string_matrix
Tensor< string, 2 > to_string_matrix() const
Writes as matrix of strings the most representative atributes.
Definition: adaptive_moment_estimation.cpp:472

OpenNN::AdaptiveMomentEstimation::beta_1
type beta_1
Exponential decay over gradient estimates.
Definition: adaptive_moment_estimation.h:138

OpenNN::AdaptiveMomentEstimation::write_optimization_algorithm_type
string write_optimization_algorithm_type() const
Return the algorithm optimum for your model.
Definition: adaptive_moment_estimation.cpp:464

OpenNN::AdaptiveMomentEstimation::set_initial_learning_rate
void set_initial_learning_rate(const type &)
Definition: adaptive_moment_estimation.cpp:106

OpenNN::AdaptiveMomentEstimation::set_maximum_time
void set_maximum_time(const type &)
Definition: adaptive_moment_estimation.cpp:178

OpenNN::AdaptiveMomentEstimation::set_loss_goal
void set_loss_goal(const type &)
Definition: adaptive_moment_estimation.cpp:169

OpenNN::AdaptiveMomentEstimation::epsilon
type epsilon
Small number to prevent any division by zero.
Definition: adaptive_moment_estimation.h:146

OpenNN::AdaptiveMomentEstimation::set_beta_2
void set_beta_2(const type &)
Definition: adaptive_moment_estimation.cpp:124

OpenNN::AdaptiveMomentEstimation::set_batch_samples_number
void set_batch_samples_number(const Index &new_batch_samples_number)
Set number of samples in each batch. Default 1000.
Definition: adaptive_moment_estimation.cpp:708

OpenNN::AdaptiveMomentEstimation::maximum_time
type maximum_time
Maximum training time. It is used as a stopping criterion.
Definition: adaptive_moment_estimation.h:164

OpenNN::AdaptiveMomentEstimation::set_maximum_epochs_number
void set_maximum_epochs_number(const Index &)
Definition: adaptive_moment_estimation.cpp:142

OpenNN::AdaptiveMomentEstimation::update_parameters
void update_parameters(LossIndexBackPropagation &, AdaptiveMomentEstimationData &)
Update iteration parameters.
Definition: adaptive_moment_estimation.cpp:728

OpenNN::AdaptiveMomentEstimation::initial_decay
type initial_decay
Learning rate decay over each update.
Definition: adaptive_moment_estimation.h:134

OpenNN::AdaptiveMomentEstimation::training_loss_goal
type training_loss_goal
Goal value for the loss. It is used as a stopping criterion.
Definition: adaptive_moment_estimation.h:152

OpenNN::AdaptiveMomentEstimation::~AdaptiveMomentEstimation
virtual ~AdaptiveMomentEstimation()
Destructor.
Definition: adaptive_moment_estimation.cpp:39

OpenNN::AdaptiveMomentEstimation::maximum_epochs_number
Index maximum_epochs_number
Maximum epochs number.
Definition: adaptive_moment_estimation.h:156

OpenNN::AdaptiveMomentEstimation::write_XML
void write_XML(tinyxml2::XMLPrinter &) const
Definition: adaptive_moment_estimation.cpp:528

OpenNN::AdaptiveMomentEstimation::batch_samples_number
Index batch_samples_number
Training and selection batch size.
Definition: adaptive_moment_estimation.h:168

OpenNN::AdaptiveMomentEstimation::maximum_selection_failures
Index maximum_selection_failures
Maximum number of times when selection error increases.
Definition: adaptive_moment_estimation.h:160

OpenNN::AdaptiveMomentEstimation::set_beta_1
void set_beta_1(const type &)
Definition: adaptive_moment_estimation.cpp:115

OpenNN::AdaptiveMomentEstimation::get_initial_learning_rate
const type & get_initial_learning_rate() const
Returns the initial learning rate.
Definition: adaptive_moment_estimation.cpp:46

OpenNN::AdaptiveMomentEstimation::beta_2
type beta_2
Exponential decay over square gradient estimates.
Definition: adaptive_moment_estimation.h:142

OpenNN::LossIndex
This abstract class represents the concept of loss index composed of an error term and a regularizati...
Definition: loss_index.h:48

OpenNN::OptimizationAlgorithm
Definition: optimization_algorithm.h:42

tinyxml2::XMLDocument
Definition: tinyxml2.h:1653

tinyxml2::XMLPrinter
Definition: tinyxml2.h:2154

OpenNN::AdaptiveMomentEstimationData
Definition: adaptive_moment_estimation.h:178

OpenNN::AdaptiveMomentEstimationData::AdaptiveMomentEstimationData
AdaptiveMomentEstimationData()
Default constructor.
Definition: adaptive_moment_estimation.cpp:755

OpenNN::LossIndexBackPropagation
Definition: loss_index.h:290

OpenNN::OptimizationAlgorithmData
Definition: optimization_algorithm.h:168

OpenNN::TrainingResults
This structure contains the optimization algorithm results.
Definition: optimization_algorithm.h:198