documentation/reference/quasi__newton__method_8h_source.html

//   OpenNN: Open Neural Networks Library

//   www.opennn.net

//

//   Q U A S I - N E W T O N   M E T H O D    C L A S S   H E A D E R

//

//   Artificial Intelligence Techniques SL

//   artelnics@artelnics.com


#pragma once


#include "loss.h"

#include "optimizer.h"

#include "forward_propagation.h"

#include "back_propagation.h"


namespace opennn

{


class QuasiNewtonMethod final : public Optimizer

{


public:


    enum DataSlot {

        OldParameters,

        ParameterDifferences,

        ParameterUpdates,

        OldGradient,

        GradientDifference,

        OldInverseHessianDotGradientDifference,

        BFGS,

        InverseHessian,

        OldInverseHessian

    };


    QuasiNewtonMethod(Loss* = nullptr);

    void set_default();

    void set_minimum_loss_decrease(const float new_minimum_loss_decrease) { minimum_loss_decrease = new_minimum_loss_decrease; }

    void update_parameters(const Batch& , ForwardPropagation& , BackPropagation& , OptimizerData&);


    TrainingResults train() override;

    void from_JSON(const JsonDocument&) override;


    void to_JSON(JsonWriter&) const override;


private:


    void calculate_inverse_hessian(OptimizerData&) const;


    pair<float, float> calculate_directional_point(const Batch&,

                                                 ForwardPropagation&,

                                                 BackPropagation&,

                                                 OptimizerData&,

                                                 float);


    float first_learning_rate = 0.01f;


    // Stopping criteria


    float minimum_loss_decrease = EPSILON;


    // Optimizer-specific state (not shared across optimizers, so not in OptimizerData)


    float training_slope = 0.0f;

    float learning_rate = 0.0f;

    float old_learning_rate = 0.0f;

};


}


// OpenNN: Open Neural Networks Library.

// Copyright(C) 2005-2026 Artificial Intelligence Techniques, SL.

// Licensed under the GNU Lesser General Public License v2.1 or later.

back_propagation.h

opennn::JsonDocument
Definition json.h:72

opennn::JsonWriter
Definition json.h:85

opennn::Loss
Unified loss container supporting MSE, cross-entropy, Minkowski, weighted, and regularized variants.
Definition loss.h:24

opennn::Optimizer::Optimizer
Optimizer(Loss *=nullptr)
Constructs an optimizer optionally bound to a Loss instance.

opennn::QuasiNewtonMethod::train
TrainingResults train() override
Runs the quasi-Newton training loop and returns the recorded error history.

opennn::QuasiNewtonMethod::DataSlot
DataSlot
Slot indices into the optimizer scratch buffer (BFGS state).
Definition quasi_newton_method.h:26

opennn::QuasiNewtonMethod::InverseHessian
@ InverseHessian
Definition quasi_newton_method.h:34

opennn::QuasiNewtonMethod::OldInverseHessian
@ OldInverseHessian
Definition quasi_newton_method.h:35

opennn::QuasiNewtonMethod::ParameterUpdates
@ ParameterUpdates
Definition quasi_newton_method.h:29

opennn::QuasiNewtonMethod::BFGS
@ BFGS
Definition quasi_newton_method.h:33

opennn::QuasiNewtonMethod::OldParameters
@ OldParameters
Definition quasi_newton_method.h:27

opennn::QuasiNewtonMethod::ParameterDifferences
@ ParameterDifferences
Definition quasi_newton_method.h:28

opennn::QuasiNewtonMethod::GradientDifference
@ GradientDifference
Definition quasi_newton_method.h:31

opennn::QuasiNewtonMethod::OldGradient
@ OldGradient
Definition quasi_newton_method.h:30

opennn::QuasiNewtonMethod::OldInverseHessianDotGradientDifference
@ OldInverseHessianDotGradientDifference
Definition quasi_newton_method.h:32

opennn::QuasiNewtonMethod::to_JSON
void to_JSON(JsonWriter &) const override
Serializes hyperparameters to JSON.

opennn::QuasiNewtonMethod::QuasiNewtonMethod
QuasiNewtonMethod(Loss *=nullptr)
Constructs the quasi-Newton optimizer optionally bound to a Loss instance.

opennn::QuasiNewtonMethod::set_minimum_loss_decrease
void set_minimum_loss_decrease(const float new_minimum_loss_decrease)
Definition quasi_newton_method.h:42

opennn::QuasiNewtonMethod::update_parameters
void update_parameters(const Batch &, ForwardPropagation &, BackPropagation &, OptimizerData &)
Applies one BFGS update: line search along the search direction, then refreshes the inverse Hessian.

opennn::QuasiNewtonMethod::from_JSON
void from_JSON(const JsonDocument &) override
Restores hyperparameters from a JSON document.

opennn::QuasiNewtonMethod::set_default
void set_default()
Resets all hyperparameters and stopping criteria to library defaults.

forward_propagation.h

loss.h

opennn
Definition adaptive_moment_estimation.h:14

opennn::EPSILON
constexpr float EPSILON
Definition pch.h:155

optimizer.h

opennn::BackPropagation
Workspace holding parameter gradients and per-layer deltas during a backward pass.
Definition back_propagation.h:21

opennn::Batch
Minibatch container holding pinned host/device buffers and views into a Dataset.
Definition batch.h:19

opennn::ForwardPropagation
Workspace holding the activations of every layer during a forward pass.
Definition forward_propagation.h:20

opennn::OptimizerData
Per-optimizer scratch state (moments, directions, iteration counter) backing the update step.
Definition optimizer.h:182

opennn::TrainingResults
History and final metrics produced by a training run.
Definition optimizer.h:204