documentation/reference/optimizer_8h_source.html

//   OpenNN: Open Neural Networks Library

//   www.opennn.net

//

//   O P T I M I Z A T I O N   A L G O R I T H M   C L A S S   H E A D E R

//

//   Artificial Intelligence Techniques SL

//   artelnics@artelnics.com


#pragma once


#include <functional>

#include "json.h"

#include "tensor_utilities.h"

#include "thread_safe_queue.h"


namespace opennn

{


class Loss;

struct Batch;

struct Buffer;

struct ForwardPropagation;

struct BackPropagation;


struct TrainingResults;


struct EpochStats

{

    float error = 0.0f;

    float accuracy = 0.0f;

};


class Optimizer

{


public:


    Optimizer(Loss* loss = nullptr);

    virtual ~Optimizer() = default;


    enum class StoppingCondition{None,

                                 MinimumLossDecrease,

                                 LossGoal,

                                 MaximumSelectionErrorIncreases,

                                 MaximumEpochsNumber,

                                 MaximumTime};


    const Loss* get_loss() const { return loss; }


    bool get_display() const { return display; }


    void set(Loss* new_loss) { loss = new_loss; }


    virtual void set_loss(Loss* new_loss) { loss = new_loss; }


    virtual void set_display(bool new_display) { display = new_display; }


    void set_display_period(const Index new_display_period) { display_period = new_display_period; }


    void set_maximum_epochs(const Index new_maximum_epochs) { maximum_epochs = new_maximum_epochs; }

    void set_maximum_time(const float new_maximum_time) { maximum_time = new_maximum_time; }


    void set_loss_goal(const float new_loss_goal) { training_loss_goal = new_loss_goal; }

    void set_maximum_validation_failures(const Index new_maximum_validation_failures) { maximum_validation_failures = new_maximum_validation_failures; }

    virtual TrainingResults train() = 0;


    const string& get_name() const { return name; }


    virtual void print() const {}


    virtual void from_JSON(const JsonDocument&);


    virtual void to_JSON(JsonWriter&) const;


    void save(const filesystem::path&) const;

    void load(const filesystem::path&);


    static float get_elapsed_time(const time_t& beginning_time);


protected:


    void set_names();

    void set_scaling();

    void set_unscaling();


    bool check_stopping_condition(TrainingResults& results, Index epoch, float elapsed_time,

                                   float training_error, Index validation_failures) const;


    void write_common_xml(JsonWriter&) const;

    void read_common_xml(const Json*);


    void setup_device_training();

    void teardown_device_training();


    void prefetch_batch(Batch& batch, Index sample_count, int slot);


    void wait_prefetch(int slot);


    void sync_device();


    static void clip_gradient_norm(Buffer& gradient, float max_norm);


    bool should_display(Index epoch) const { return display && epoch % display_period == 0; }


    EpochStats train_epoch(bool is_classification,

                           ForwardPropagation& forward_propagation,

                           BackPropagation& back_propagation,

                           ThreadSafeQueue<Batch*>& empty_queue,

                           ThreadSafeQueue<Batch*>& ready_queue,

                           const vector<vector<Index>>& batches,

                           const vector<Index>& input_feature_indices,

                           const vector<Index>& decoder_feature_indices,

                           const vector<Index>& target_feature_indices,

                           const std::function<void(BackPropagation&)>& update);


    EpochStats evaluate_epoch(bool is_classification,

                              ForwardPropagation& forward_propagation,

                              ThreadSafeQueue<Batch*>& empty_queue,

                              ThreadSafeQueue<Batch*>& ready_queue,

                              const vector<vector<Index>>& batches,

                              const vector<Index>& input_feature_indices,

                              const vector<Index>& decoder_feature_indices,

                              const vector<Index>& target_feature_indices);


    Loss* loss = nullptr;


    float training_loss_goal = 0.0f;


    Index maximum_validation_failures = numeric_limits<Index>::max();


    Index maximum_epochs = 10000;


    float maximum_time = 360000.0f;


    Index display_period = 10;


    bool display = true;


    string name;


    cudaStream_t memory_stream = nullptr;

    cudaEvent_t batch_ready_event[2] = {nullptr, nullptr};

};


struct OptimizerData

{

    OptimizerData() = default;

    virtual ~OptimizerData() = default;


    virtual void print() const;


    void set(const vector<Shape>& slot_shapes, Device device = Device::CPU);


    Buffer data;

    vector<TensorView> views;


    VectorR potential_parameters;

    VectorR training_direction;

    float initial_learning_rate = 0.0f;

    Index iteration = 0;

};


struct TrainingResults

{

    TrainingResults(const Index expected_epochs = 0);

    virtual ~TrainingResults() = default;


    string write_stopping_condition() const;


    float get_training_error() const;


    float get_validation_error() const;


    Index get_epochs_number() const;


    void save(const filesystem::path&) const;


    void print(const string& message = string()) const;


    Optimizer::StoppingCondition stopping_condition = Optimizer::StoppingCondition::None;


    Tensor<string, 2> write_override_results(const Index decimals = 3) const;


    void resize_training_error_history(const Index);


    void resize_validation_error_history(const Index);


    VectorR training_error_history;


    VectorR validation_error_history;


    string elapsed_time;


    float loss = NAN;


    Index validation_failures = 0;


    float loss_decrease = 0.0f;

};


}


// OpenNN: Open Neural Networks Library.

// Copyright(C) 2005-2026 Artificial Intelligence Techniques, SL.

// Licensed under the GNU Lesser General Public License v2.1 or later.

opennn::JsonDocument
Definition json.h:71

opennn::JsonWriter
Definition json.h:84

opennn::Json
Definition json.h:22

opennn::Loss
Trainable loss function attached to a NeuralNetwork and a Dataset.
Definition loss.h:44

opennn::Optimizer::get_display
bool get_display() const
Whether progress should be printed to stdout during training.
Definition optimizer.h:91

opennn::Optimizer::clip_gradient_norm
static void clip_gradient_norm(Buffer &gradient, float max_norm)
In-place gradient norm clipping.

opennn::Optimizer::training_loss_goal
float training_loss_goal
Training stops when the training loss reaches this value.
Definition optimizer.h:303

opennn::Optimizer::write_common_xml
void write_common_xml(JsonWriter &) const
Writes the common Optimizer fields to JSON.

opennn::Optimizer::should_display
bool should_display(Index epoch) const
Whether the current epoch should print progress.
Definition optimizer.h:249

opennn::Optimizer::get_loss
const Loss * get_loss() const
Read-only access to the loss being optimized.
Definition optimizer.h:88

opennn::Optimizer::from_JSON
virtual void from_JSON(const JsonDocument &)
Loads optimizer hyperparameters from a parsed JSON document.

opennn::Optimizer::batch_ready_event
cudaEvent_t batch_ready_event[2]
CUDA events signaling when each prefetched batch is ready.
Definition optimizer.h:326

opennn::Optimizer::set_maximum_time
void set_maximum_time(const float new_maximum_time)
Sets the maximum wall-clock training time.
Definition optimizer.h:127

opennn::Optimizer::setup_device_training
void setup_device_training()
Allocates the CUDA stream and events used for batch prefetching.

opennn::Optimizer::train_epoch
EpochStats train_epoch(bool is_classification, ForwardPropagation &forward_propagation, BackPropagation &back_propagation, ThreadSafeQueue< Batch * > &empty_queue, ThreadSafeQueue< Batch * > &ready_queue, const vector< vector< Index > > &batches, const vector< Index > &input_feature_indices, const vector< Index > &decoder_feature_indices, const vector< Index > &target_feature_indices, const std::function< void(BackPropagation &)> &update)
Runs a single training epoch over all batches.

opennn::Optimizer::read_common_xml
void read_common_xml(const Json *)
Reads the common Optimizer fields from JSON.

opennn::Optimizer::save
void save(const filesystem::path &) const
Saves the optimizer state to a file.

opennn::Optimizer::evaluate_epoch
EpochStats evaluate_epoch(bool is_classification, ForwardPropagation &forward_propagation, ThreadSafeQueue< Batch * > &empty_queue, ThreadSafeQueue< Batch * > &ready_queue, const vector< vector< Index > > &batches, const vector< Index > &input_feature_indices, const vector< Index > &decoder_feature_indices, const vector< Index > &target_feature_indices)
Runs a single evaluation pass over all batches without updating parameters.

opennn::Optimizer::set_unscaling
void set_unscaling()
Subclass hook to install the dataset-derived output unscalers.

opennn::Optimizer::loss
Loss * loss
Loss being optimized; not owned.
Definition optimizer.h:300

opennn::Optimizer::train
virtual TrainingResults train()=0
Runs the optimization to completion.

opennn::Optimizer::prefetch_batch
void prefetch_batch(Batch &batch, Index sample_count, int slot)
Asynchronously prefetches the next training batch into a slot.

opennn::Optimizer::display
bool display
Whether progress should be printed to stdout during training.
Definition optimizer.h:318

opennn::Optimizer::teardown_device_training
void teardown_device_training()
Releases the CUDA stream and events allocated by setup_device_training().

opennn::Optimizer::set_display_period
void set_display_period(const Index new_display_period)
Sets how often progress is printed.
Definition optimizer.h:116

opennn::Optimizer::display_period
Index display_period
Number of epochs between progress prints.
Definition optimizer.h:315

opennn::Optimizer::set_names
void set_names()
Subclass hook to refresh layer name caches after a loss change.

opennn::Optimizer::maximum_validation_failures
Index maximum_validation_failures
Maximum number of consecutive validation-error increases tolerated.
Definition optimizer.h:306

opennn::Optimizer::wait_prefetch
void wait_prefetch(int slot)
Waits for the prefetch into a given slot to finish.

opennn::Optimizer::print
virtual void print() const
Prints a human-readable summary of the optimizer to stdout.
Definition optimizer.h:149

opennn::Optimizer::~Optimizer
virtual ~Optimizer()=default
Virtual destructor.

opennn::Optimizer::get_name
const string & get_name() const
Canonical name of the optimizer (set by subclasses).
Definition optimizer.h:146

opennn::Optimizer::StoppingCondition
StoppingCondition
Reasons that can terminate a training run.
Definition optimizer.h:80

opennn::Optimizer::StoppingCondition::MaximumEpochsNumber
@ MaximumEpochsNumber
Configured epoch budget exhausted.
Definition optimizer.h:84

opennn::Optimizer::StoppingCondition::MaximumSelectionErrorIncreases
@ MaximumSelectionErrorIncreases
Validation error increased too many times.
Definition optimizer.h:83

opennn::Optimizer::StoppingCondition::None
@ None
No stopping condition was hit (still running).
Definition optimizer.h:80

opennn::Optimizer::StoppingCondition::LossGoal
@ LossGoal
Training loss reached the configured goal.
Definition optimizer.h:82

opennn::Optimizer::StoppingCondition::MinimumLossDecrease
@ MinimumLossDecrease
Loss decrease between epochs fell below the threshold.
Definition optimizer.h:81

opennn::Optimizer::StoppingCondition::MaximumTime
@ MaximumTime
Definition optimizer.h:85

opennn::Optimizer::sync_device
void sync_device()
Synchronizes the device on the optimizer's CUDA stream.

opennn::Optimizer::set_loss_goal
void set_loss_goal(const float new_loss_goal)
Sets the training-loss goal.
Definition optimizer.h:133

opennn::Optimizer::set_maximum_epochs
void set_maximum_epochs(const Index new_maximum_epochs)
Sets the maximum number of epochs.
Definition optimizer.h:122

opennn::Optimizer::name
string name
Canonical name of the optimizer (set by subclasses).
Definition optimizer.h:321

opennn::Optimizer::to_JSON
virtual void to_JSON(JsonWriter &) const
Writes optimizer hyperparameters to a streaming JSON writer.

opennn::Optimizer::get_elapsed_time
static float get_elapsed_time(const time_t &beginning_time)
Computes the elapsed wall-clock time since a reference instant.

opennn::Optimizer::set_loss
virtual void set_loss(Loss *new_loss)
Updates the loss pointer; subclasses may override to refresh cached state derived from the loss.
Definition optimizer.h:104

opennn::Optimizer::maximum_epochs
Index maximum_epochs
Maximum number of training epochs.
Definition optimizer.h:309

opennn::Optimizer::load
void load(const filesystem::path &)
Loads the optimizer state from a file.

opennn::Optimizer::set_scaling
void set_scaling()
Subclass hook to install the dataset-derived input scalers.

opennn::Optimizer::maximum_time
float maximum_time
Maximum wall-clock training time in seconds.
Definition optimizer.h:312

opennn::Optimizer::set_maximum_validation_failures
void set_maximum_validation_failures(const Index new_maximum_validation_failures)
Sets the maximum number of consecutive validation-error increases tolerated.
Definition optimizer.h:138

opennn::Optimizer::set
void set(Loss *new_loss)
Re-initializes the optimizer by setting its loss pointer.
Definition optimizer.h:97

opennn::Optimizer::check_stopping_condition
bool check_stopping_condition(TrainingResults &results, Index epoch, float elapsed_time, float training_error, Index validation_failures) const
Evaluates every stopping criterion and updates the result accordingly.

opennn::Optimizer::memory_stream
cudaStream_t memory_stream
CUDA stream used to prefetch batches into device memory.
Definition optimizer.h:324

opennn::Optimizer::set_display
virtual void set_display(bool new_display)
Toggles per-epoch progress printing.
Definition optimizer.h:110

opennn::Optimizer::Optimizer
Optimizer(Loss *loss=nullptr)
Constructs an optimizer bound to a loss function.

opennn::ThreadSafeQueue
Definition thread_safe_queue.h:24

json.h

opennn
Definition adaptive_moment_estimation.h:19

opennn::cudaStream_t
void * cudaStream_t
Definition neural_network.h:71

opennn::VectorR
Matrix< float, Dynamic, 1 > VectorR
Definition neural_network.h:156

opennn::cudaEvent_t
void * cudaEvent_t
Definition neural_network.h:72

opennn::Device
Device
Definition configuration.h:16

opennn::Device::CPU
@ CPU
Definition configuration.h:16

opennn::BackPropagation
Definition back_propagation.h:26

opennn::Batch
Owns the host-side and (optional) device-side buffers for one mini-batch of dataset samples.
Definition batch.h:37

opennn::Buffer
Definition tensor_utilities.h:144

opennn::EpochStats
Aggregate metrics produced for a single training or evaluation epoch.
Definition optimizer.h:43

opennn::EpochStats::error
float error
Mean loss over the epoch.
Definition optimizer.h:45

opennn::EpochStats::accuracy
float accuracy
Mean classification accuracy over the epoch (0 if not classification).
Definition optimizer.h:47

opennn::ForwardPropagation
Definition forward_propagation.h:19

opennn::OptimizerData::OptimizerData
OptimizerData()=default
Default constructor; data buffer left empty.

opennn::OptimizerData::training_direction
VectorR training_direction
Current search direction (e.g. quasi-Newton step).
Definition optimizer.h:362

opennn::OptimizerData::potential_parameters
VectorR potential_parameters
Candidate parameter vector used by line searches.
Definition optimizer.h:360

opennn::OptimizerData::data
Buffer data
Owning storage for the per-slot scratch tensors.
Definition optimizer.h:355

opennn::OptimizerData::set
void set(const vector< Shape > &slot_shapes, Device device=Device::CPU)
Allocates the scratch buffer and slices it into views.

opennn::OptimizerData::print
virtual void print() const
Prints a human-readable summary of the scratch state.

opennn::OptimizerData::views
vector< TensorView > views
Per-slot non-owning views into data.
Definition optimizer.h:357

opennn::OptimizerData::iteration
Index iteration
Iteration counter used by adaptive optimizers.
Definition optimizer.h:366

opennn::OptimizerData::~OptimizerData
virtual ~OptimizerData()=default
Virtual destructor.

opennn::OptimizerData::initial_learning_rate
float initial_learning_rate
Initial learning rate at the start of a line search.
Definition optimizer.h:364

opennn::TrainingResults
Per-epoch error history and final summary produced by Optimizer::train().
Definition optimizer.h:374

opennn::TrainingResults::training_error_history
VectorR training_error_history
Per-epoch training error.
Definition optimizer.h:436

opennn::TrainingResults::loss
float loss
Final loss value.
Definition optimizer.h:445

opennn::TrainingResults::resize_validation_error_history
void resize_validation_error_history(const Index)
Resizes the validation error history.

opennn::TrainingResults::validation_failures
Index validation_failures
Number of consecutive validation-error increases at end of training.
Definition optimizer.h:448

opennn::TrainingResults::resize_training_error_history
void resize_training_error_history(const Index)
Resizes the training error history.

opennn::TrainingResults::~TrainingResults
virtual ~TrainingResults()=default
Virtual destructor.

opennn::TrainingResults::validation_error_history
VectorR validation_error_history
Per-epoch validation error.
Definition optimizer.h:439

opennn::TrainingResults::TrainingResults
TrainingResults(const Index expected_epochs=0)
Constructs a TrainingResults pre-sized for an expected epoch count.

opennn::TrainingResults::get_training_error
float get_training_error() const
Final training error (last entry of training_error_history).

opennn::TrainingResults::write_override_results
Tensor< string, 2 > write_override_results(const Index decimals=3) const
Returns a 2D string table summarizing the training run.

opennn::TrainingResults::elapsed_time
string elapsed_time
Total elapsed wall-clock time, formatted as "hh:mm:ss".
Definition optimizer.h:442

opennn::TrainingResults::save
void save(const filesystem::path &) const
Saves the training results (history and final summary) to a file.

opennn::TrainingResults::write_stopping_condition
string write_stopping_condition() const
Returns the canonical string name of the stopping condition.

opennn::TrainingResults::get_epochs_number
Index get_epochs_number() const
Number of epochs effectively run.

opennn::TrainingResults::get_validation_error
float get_validation_error() const
Final validation error (last entry of validation_error_history).

opennn::TrainingResults::stopping_condition
Optimizer::StoppingCondition stopping_condition
Stopping condition that ended the training run.
Definition optimizer.h:412

opennn::TrainingResults::print
void print(const string &message=string()) const
Prints a human-readable summary to stdout.

opennn::TrainingResults::loss_decrease
float loss_decrease
Loss decrease observed in the last epoch.
Definition optimizer.h:451

tensor_utilities.h

thread_safe_queue.h