documentation/reference/conjugate__gradient_8cpp_source.html

//   OpenNN: Open Neural Networks Library

//   www.opennn.net

//

//   C O N J U G A T E   G R A D I E N T   C L A S S

//

//   Artificial Intelligence Techniques SL

//   artelnics@artelnics.com


#include "conjugate_gradient.h"

#include "training_strategy.h"


namespace OpenNN

{


ConjugateGradient::ConjugateGradient()

    : OptimizationAlgorithm()

{

    set_default();

}


ConjugateGradient::ConjugateGradient(LossIndex* new_loss_index_pointer)

    : OptimizationAlgorithm(new_loss_index_pointer)

{

    learning_rate_algorithm.set_loss_index_pointer(new_loss_index_pointer);


    set_default();

}


ConjugateGradient::~ConjugateGradient()

{

}


const LearningRateAlgorithm& ConjugateGradient::get_learning_rate_algorithm() const

{

    return learning_rate_algorithm;

}


LearningRateAlgorithm* ConjugateGradient::get_learning_rate_algorithm_pointer()

{

    return &learning_rate_algorithm;

}


const ConjugateGradient::TrainingDirectionMethod& ConjugateGradient::get_training_direction_method() const

{

    return training_direction_method;

}


string ConjugateGradient::write_training_direction_method() const

{

    switch(training_direction_method)

    {

    case TrainingDirectionMethod::PR:

        return "PR";


    case TrainingDirectionMethod::FR:

        return "FR";

    }


    return string();

}


const type& ConjugateGradient::get_minimum_loss_decrease() const

{

    return minimum_loss_decrease;

}


const type& ConjugateGradient::get_loss_goal() const

{

    return training_loss_goal;

}


const Index& ConjugateGradient::get_maximum_selection_failures() const

{

    return maximum_selection_failures;

}


const Index& ConjugateGradient::get_maximum_epochs_number() const

{

    return maximum_epochs_number;

}


const type& ConjugateGradient::get_maximum_time() const

{

    return maximum_time;

}


void ConjugateGradient::set_loss_index_pointer(LossIndex* new_loss_index_pointer)

{

    loss_index_pointer = new_loss_index_pointer;


    learning_rate_algorithm.set_loss_index_pointer(new_loss_index_pointer);

}


void ConjugateGradient::set_training_direction_method

(const ConjugateGradient::TrainingDirectionMethod& new_training_direction_method)

{

    training_direction_method = new_training_direction_method;

}


void ConjugateGradient::set_training_direction_method(const string& new_training_direction_method_name)

{

    if(new_training_direction_method_name == "PR")

    {

        training_direction_method = TrainingDirectionMethod::PR;


    }

    else if(new_training_direction_method_name == "FR")

    {

        training_direction_method = TrainingDirectionMethod::FR;

    }

    else

    {

        ostringstream buffer;


        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "void set_training_direction_method(const string&) method.\n"

               << "Unknown training direction method: " << new_training_direction_method_name << ".\n";


        throw logic_error(buffer.str());

    }

}


void ConjugateGradient::set_default()

{

    // Stopping criteria


    minimum_loss_decrease = type(0);

    training_loss_goal = type(0);

    maximum_selection_failures = 1000000;


    maximum_epochs_number = 1000;

    maximum_time = type(3600.0);


    // UTILITIES


    display_period = 10;


    training_direction_method = TrainingDirectionMethod::FR;

}


void ConjugateGradient::set_minimum_loss_decrease(const type& new_minimum_loss_decrease)

{

    minimum_loss_decrease = new_minimum_loss_decrease;

}


void ConjugateGradient::set_loss_goal(const type& new_loss_goal)

{

    training_loss_goal = new_loss_goal;

}


void ConjugateGradient::set_maximum_selection_failures(const Index& new_maximum_selection_failures)

{

    maximum_selection_failures = new_maximum_selection_failures;

}


void ConjugateGradient::set_maximum_epochs_number(const Index& new_maximum_epochs_number)

{

    maximum_epochs_number = new_maximum_epochs_number;

}


void ConjugateGradient::set_maximum_time(const type& new_maximum_time)

{

#ifdef OPENNN_DEBUG


    if(new_maximum_time < static_cast<type>(0.0))

    {

        ostringstream buffer;


        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "void set_maximum_time(const type&) method.\n"

               << "Maximum time must be equal or greater than 0.\n";


        throw logic_error(buffer.str());

    }


#endif


    // Set maximum time


    maximum_time = new_maximum_time;

}


void ConjugateGradient::set_save_period(const Index& new_save_period)

{

#ifdef OPENNN_DEBUG


    if(new_save_period <= 0)

    {

        ostringstream buffer;


        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "void set_save_period(const type&) method.\n"

               << "Save period must be greater than 0.\n";


        throw logic_error(buffer.str());

    }


#endif


    save_period = new_save_period;

}


type ConjugateGradient::calculate_FR_parameter(const Tensor<type, 1>& old_gradient, const Tensor<type, 1>& gradient) const

{

#ifdef OPENNN_DEBUG


    ostringstream buffer;


    if(!loss_index_pointer)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "type calculate_FR_parameter(const Tensor<type, 1>&, const Tensor<type, 1>&) const method.\n"


               << "Loss index pointer is nullptr.\n";


        throw logic_error(buffer.str());

    }


    const NeuralNetwork* neural_network_pointer = loss_index_pointer->get_neural_network_pointer();


    const Index parameters_number = neural_network_pointer->get_parameters_number();


    const Index old_gradient_size = old_gradient.size();


    if(old_gradient_size != parameters_number)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "type calculate_FR_parameter(const Tensor<type, 1>&, const Tensor<type, 1>&) const method.\n"

               << "Size of old gradient(" << old_gradient_size << ") is not equal to number of parameters(" << parameters_number << ").\n";


        throw logic_error(buffer.str());

    }


    const Index gradient_size = gradient.size();


    if(gradient_size != parameters_number)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "type calculate_FR_parameter(const Tensor<type, 1>&, const Tensor<type, 1>&) const method.\n"

               << "Size of gradient(" << gradient_size << ") is not equal to number of parameters(" << parameters_number << ").\n";


        throw logic_error(buffer.str());

    }


#endif


    type FR_parameter = type(0);


    Tensor<type, 0> numerator;

    Tensor<type, 0> denominator;


    numerator.device(*thread_pool_device) = gradient.contract(gradient, AT_B);

    denominator.device(*thread_pool_device) = old_gradient.contract(old_gradient, AT_B);


    // Prevent a possible division by 0


    if(abs(denominator(0)) < type(NUMERIC_LIMITS_MIN))

    {

        FR_parameter = type(0);

    }

    else

    {

        FR_parameter = numerator(0)/denominator(0);

    }


    // Bound the Fletcher-Reeves parameter between 0 and 1


    if(FR_parameter < static_cast<type>(0.0))

    {

        FR_parameter = type(0);

    }

    else if(FR_parameter > static_cast<type>(1.0))

    {

        FR_parameter = type(1);

    }


    return FR_parameter;

}


type ConjugateGradient::calculate_PR_parameter(const Tensor<type, 1>& old_gradient, const Tensor<type, 1>& gradient) const

{

#ifdef OPENNN_DEBUG


    ostringstream buffer;


    if(!loss_index_pointer)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "type calculate_PR_parameter(const Tensor<type, 1>&, const Tensor<type, 1>&) const method.\n"

               << "Loss index pointer is nullptr.\n";


        throw logic_error(buffer.str());

    }


    const NeuralNetwork* neural_network_pointer = loss_index_pointer->get_neural_network_pointer();


    const Index parameters_number = neural_network_pointer->get_parameters_number();


    const Index old_gradient_size = old_gradient.size();


    if(old_gradient_size != parameters_number)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "type calculate_PR_parameter(const Tensor<type, 1>&, const Tensor<type, 1>&) const method.\n"

               << "Size of old gradient(" << old_gradient_size << ") is not equal to number of parameters(" << parameters_number << ").\n";


        throw logic_error(buffer.str());

    }


    const Index gradient_size = gradient.size();


    if(gradient_size != parameters_number)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "type calculate_PR_parameter(const Tensor<type, 1>&, const Tensor<type, 1>&) const method.\n"

               << "Size of gradient(" << gradient_size << ") is not equal to number of parameters(" << parameters_number << ").\n";


        throw logic_error(buffer.str());

    }


#endif


    type PR_parameter = type(0);


    Tensor<type, 0> numerator;

    Tensor<type, 0> denominator;


    numerator.device(*thread_pool_device) = (gradient-old_gradient).contract(gradient, AT_B);

    denominator.device(*thread_pool_device) = old_gradient.contract(old_gradient, AT_B);


    // Prevent a possible division by 0


    if(abs(denominator(0)) < type(NUMERIC_LIMITS_MIN))

    {

        PR_parameter = type(0);

    }

    else

    {

        PR_parameter = numerator(0)/denominator(0);

    }


    // Bound the Polak-Ribiere parameter between 0 and 1


    if(PR_parameter < static_cast<type>(0.0))

    {

        PR_parameter = type(0);

    }

    else if(PR_parameter > static_cast<type>(1.0))

    {

        PR_parameter = type(1);

    }


    return PR_parameter;


}


void ConjugateGradient::calculate_PR_training_direction(const Tensor<type, 1>& old_gradient,

                                                        const Tensor<type, 1>& gradient,

                                                        const Tensor<type, 1>& old_training_direction,

                                                        Tensor<type, 1>& training_direction) const

{

#ifdef OPENNN_DEBUG


    ostringstream buffer;


    if(!loss_index_pointer)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "void calculate_PR_training_direction() const method.\n"

               << "Loss index pointer is nullptr.\n";


        throw logic_error(buffer.str());

    }


    const NeuralNetwork* neural_network_pointer = loss_index_pointer->get_neural_network_pointer();


    const Index parameters_number = neural_network_pointer->get_parameters_number();


    const Index old_gradient_size = old_gradient.size();


    if(old_gradient_size != parameters_number)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "void calculate_PR_training_direction() const method.\n"

               << "Size of old gradient(" << old_gradient_size << ") is not equal to number of parameters(" << parameters_number << ").\n";


        throw logic_error(buffer.str());

    }


    const Index gradient_size = gradient.size();


    if(gradient_size != parameters_number)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "void calculate_PR_training_direction() const method.\n"

               << "Size of gradient(" << gradient_size << ") is not equal to number of parameters(" << parameters_number << ").\n";


        throw logic_error(buffer.str());

    }


    const Index old_training_direction_size = old_training_direction.size();


    if(old_training_direction_size != parameters_number)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "void calculate_PR_training_direction() const method.\n"

               << "Size of old training direction(" << old_training_direction_size

               << ") is not equal to number of parameters(" << parameters_number << ").\n";


        throw logic_error(buffer.str());

    }


#endif


    const type PR_parameter = calculate_PR_parameter(old_gradient, gradient);


    training_direction.device(*thread_pool_device) = -gradient + old_training_direction*PR_parameter;

}


void ConjugateGradient::calculate_FR_training_direction(const Tensor<type, 1>& old_gradient,

                                                        const Tensor<type, 1>& gradient,

                                                        const Tensor<type, 1>& old_training_direction,

                                                        Tensor<type, 1>& training_direction) const

{

#ifdef OPENNN_DEBUG


    ostringstream buffer;


    if(!loss_index_pointer)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "void calculate_FR_training_direction() const method.\n"

               << "Loss index pointer is nullptr.\n";


        throw logic_error(buffer.str());

    }


    const NeuralNetwork* neural_network_pointer = loss_index_pointer->get_neural_network_pointer();


    const Index parameters_number = neural_network_pointer->get_parameters_number();


    const Index old_gradient_size = old_gradient.size();


    if(old_gradient_size != parameters_number)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "void calculate_FR_training_direction() const method.\n"

               << "Size of old gradient (" << old_gradient_size << ") is not equal to number of parameters (" << parameters_number << ").\n";


        throw logic_error(buffer.str());

    }


    const Index gradient_size = gradient.size();


    if(gradient_size != parameters_number)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "void calculate_FR_training_direction() const method.\n"

               << "Size of gradient (" << gradient_size << ") is not equal to number of parameters (" << parameters_number << ").\n";


        throw logic_error(buffer.str());

    }


    const Index old_training_direction_size = old_training_direction.size();


    if(old_training_direction_size != parameters_number)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "void calculate_FR_training_direction() const method.\n"

               << "Size of old training direction (" << old_training_direction_size

               << ") is not equal to number of parameters (" << parameters_number << ").\n";


        throw logic_error(buffer.str());

    }


#endif


    const type FR_parameter = calculate_FR_parameter(old_gradient, gradient);


    training_direction.device(*thread_pool_device) = -gradient + old_training_direction*FR_parameter;

}


// \brief ConjugateGradient::calculate_gradient_descent_training_direction

// \param gradient

// \param training_direction


void ConjugateGradient::calculate_gradient_descent_training_direction(const Tensor<type, 1>& gradient,

                                                                      Tensor<type, 1>& training_direction) const

{

    training_direction.device(*thread_pool_device) = -gradient;

}


void ConjugateGradient::calculate_conjugate_gradient_training_direction(const Tensor<type, 1>& old_gradient,

                                                                        const Tensor<type, 1>& gradient,

                                                                        const Tensor<type, 1>& old_training_direction,

                                                                        Tensor<type, 1>& training_direction) const

{


#ifdef OPENNN_DEBUG

    const NeuralNetwork* neural_network_pointer = loss_index_pointer->get_neural_network_pointer();


    const Index parameters_number = neural_network_pointer->get_parameters_number();


    ostringstream buffer;


    if(!loss_index_pointer)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "void calculate_training_direction() const method.\n"

               << "Loss index pointer is nullptr.\n";


        throw logic_error(buffer.str());

    }


    const Index old_gradient_size = old_gradient.size();


    if(old_gradient_size != parameters_number)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "void calculate_training_direction() const method.\n"

               << "Size of old gradient (" << old_gradient_size << ") is not equal to number of parameters (" << parameters_number << ").\n";


        throw logic_error(buffer.str());

    }


    const Index gradient_size = gradient.size();


    if(gradient_size != parameters_number)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "void calculate_training_direction() const method.\n"

               << "Size of gradient (" << gradient_size << ") is not equal to number of parameters (" << parameters_number << ").\n";


        throw logic_error(buffer.str());

    }


    const Index old_training_direction_size = old_training_direction.size();


    if(old_training_direction_size != parameters_number)

    {

        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "void calculate_training_direction() const method.\n"

               << "Size of old training direction (" << old_training_direction_size

               << ") is not equal to number of parameters (" << parameters_number << ").\n";


        throw logic_error(buffer.str());

    }


#endif


    switch(training_direction_method)

    {

    case TrainingDirectionMethod::FR:

        calculate_FR_training_direction(old_gradient, gradient, old_training_direction, training_direction);


        return;

    case TrainingDirectionMethod::PR:

        calculate_PR_training_direction(old_gradient, gradient, old_training_direction, training_direction);

        return;

    }

}


TrainingResults ConjugateGradient::perform_training()

{

    check();


    // Start training


    if(display) cout << "Training with conjugate gradient...\n";


    TrainingResults results(maximum_epochs_number+1);


    // Elapsed time


    time_t beginning_time, current_time;

    time(&beginning_time);

    type elapsed_time = type(0);


    // Data set


    DataSet* data_set_pointer = loss_index_pointer->get_data_set_pointer();


    const Index training_samples_number = data_set_pointer->get_training_samples_number();

    const Index selection_samples_number = data_set_pointer->get_selection_samples_number();

    const bool has_selection = data_set_pointer->has_selection();


    const Tensor<Index, 1> training_samples_indices = data_set_pointer->get_training_samples_indices();

    const Tensor<Index, 1> selection_samples_indices = data_set_pointer->get_selection_samples_indices();


    const Tensor<Index, 1> input_variables_indices = data_set_pointer->get_input_variables_indices();

    const Tensor<Index, 1> target_variables_indices = data_set_pointer->get_target_variables_indices();


    const Tensor<string, 1> inputs_names = data_set_pointer->get_input_variables_names();

    const Tensor<string, 1> targets_names = data_set_pointer->get_target_variables_names();


    const Tensor<Scaler, 1> input_variables_scalers = data_set_pointer->get_input_variables_scalers();

    const Tensor<Scaler, 1> target_variables_scalers = data_set_pointer->get_target_variables_scalers();


    const Tensor<Descriptives, 1> input_variables_descriptives = data_set_pointer->scale_input_variables();

    Tensor<Descriptives, 1> target_variables_descriptives;


    // Neural network


    NeuralNetwork* neural_network_pointer = loss_index_pointer->get_neural_network_pointer();


    if(neural_network_pointer->has_scaling_layer())

    {

        ScalingLayer* scaling_layer_pointer = neural_network_pointer->get_scaling_layer_pointer();

        scaling_layer_pointer->set(input_variables_descriptives, input_variables_scalers);

    }


    if(neural_network_pointer->has_unscaling_layer())

    {

        target_variables_descriptives = data_set_pointer->scale_target_variables();


        UnscalingLayer* unscaling_layer_pointer = neural_network_pointer->get_unscaling_layer_pointer();

        unscaling_layer_pointer->set(target_variables_descriptives, target_variables_scalers);

    }


    DataSetBatch training_batch(training_samples_number, data_set_pointer);

    training_batch.fill(training_samples_indices, input_variables_indices, target_variables_indices);


    DataSetBatch selection_batch(selection_samples_number, data_set_pointer);

    selection_batch.fill(selection_samples_indices, input_variables_indices, target_variables_indices);


    NeuralNetworkForwardPropagation training_forward_propagation(training_samples_number, neural_network_pointer);

    NeuralNetworkForwardPropagation selection_forward_propagation(selection_samples_number, neural_network_pointer);


    // Loss index


    string information;


    loss_index_pointer->set_normalization_coefficient();


    LossIndexBackPropagation training_back_propagation(training_samples_number, loss_index_pointer);

    LossIndexBackPropagation selection_back_propagation(selection_samples_number, loss_index_pointer);


    // Optimization algorithm


    type old_loss = type(0);

    type loss_decrease = numeric_limits<type>::max();


    bool stop_training = false;


    Index selection_failures = 0;


    ConjugateGradientData optimization_data(this);


    // Main loop


    for(Index epoch = 0; epoch <= maximum_epochs_number; epoch++)

    {

        if(display && epoch%display_period == 0) cout << "Epoch: " << epoch << endl;


        optimization_data.epoch = epoch;


        // Neural network


        neural_network_pointer->forward_propagate(training_batch, training_forward_propagation);


        // Loss index


        loss_index_pointer->back_propagate(training_batch, training_forward_propagation, training_back_propagation);

        results.training_error_history(epoch) = training_back_propagation.error;


        if(has_selection)

        {

            neural_network_pointer->forward_propagate(selection_batch, selection_forward_propagation);


            loss_index_pointer->calculate_errors(selection_batch, selection_forward_propagation, selection_back_propagation);

            loss_index_pointer->calculate_error(selection_batch, selection_forward_propagation, selection_back_propagation);


            results.selection_error_history(epoch) = selection_back_propagation.error;


            if(epoch != 0 && results.selection_error_history(epoch) > results.selection_error_history(epoch-1)) selection_failures++;

        }


        // Optimization algorithm


        time(&current_time);

        elapsed_time = static_cast<type>(difftime(current_time, beginning_time));


        if(display && epoch%display_period == 0)

        {

            cout << "Training error: " << training_back_propagation.error << endl;

            if(has_selection) cout << "Selection error: " << selection_back_propagation.error << endl;

            cout << "Learning rate: " << optimization_data.learning_rate << endl;

            cout << "Elapsed time: " << write_time(elapsed_time) << endl;

        }


        // Stopping Criteria


        if(training_back_propagation.loss <= training_loss_goal)

        {

            if(display) cout << "Epoch " << epoch << endl << "Loss goal reached: " << training_back_propagation.loss << endl;


            stop_training = true;


            results.stopping_condition = StoppingCondition::LossGoal;

        }


        if(has_selection && selection_failures >= maximum_selection_failures)

        {

            if(display) cout << "Epoch " << epoch << endl << "Maximum selection failures reached: " << selection_failures << endl;


            stop_training = true;


            results.stopping_condition = StoppingCondition::MaximumSelectionErrorIncreases;

        }


        if(epoch == maximum_epochs_number)

        {

            if(display) cout << "Epoch " << epoch << endl << "Maximum number of epochs reached: " << epoch << endl;;


            stop_training = true;


            results.stopping_condition = StoppingCondition::MaximumEpochsNumber;

        }


        if(elapsed_time >= maximum_time)

        {

            if(display) cout << "Epoch " << epoch << endl << "Maximum training time reached: " << write_time(elapsed_time) << endl;


            stop_training = true;


            results.stopping_condition = StoppingCondition::MaximumTime;

        }


        if(epoch != 0) loss_decrease = old_loss - training_back_propagation.loss;


        if(loss_decrease <= minimum_loss_decrease)

        {

            if(display) cout << "Epoch " << epoch << endl << "Minimum loss decrease reached: " << minimum_loss_decrease << endl;


            stop_training = true;


            results.stopping_condition = StoppingCondition::MinimumLossDecrease;

        }


        old_loss = training_back_propagation.loss;


        if(stop_training)

        {

            results.resize_training_error_history(epoch+1);

            if(has_selection) results.resize_selection_error_history(epoch+1);

            else results.resize_selection_error_history(0);


            results.elapsed_time = write_time(elapsed_time);


            break;

        }


        // Update stuff


        if(epoch != 0 && epoch%save_period == 0) neural_network_pointer->save(neural_network_file_name);


        update_parameters(training_batch, training_forward_propagation, training_back_propagation, optimization_data);

    }


    data_set_pointer->unscale_input_variables(input_variables_descriptives);


    if(neural_network_pointer->has_unscaling_layer())

        data_set_pointer->unscale_target_variables(target_variables_descriptives);


    if(display) results.print();


    return results;

}


string ConjugateGradient::write_optimization_algorithm_type() const

{

    return "CONJUGATE_GRADIENT";

}


Tensor<string, 2> ConjugateGradient::to_string_matrix() const

{

    Tensor<string, 2> labels_values(8, 2);


    // Training direction method


    labels_values(0,0) = "Training direction method";

    labels_values(0,1) = write_training_direction_method();


    // Learning rate method


    labels_values(1,0) = "Learning rate method";

    labels_values(1,1) = learning_rate_algorithm.write_learning_rate_method();


    // Learning rate tolerance


    labels_values(2,0) = "Learning rate tolerance";

    labels_values(2,1) = to_string(double(learning_rate_algorithm.get_learning_rate_tolerance()));


    // Minimum loss decrease


    labels_values(3,0) = "Minimum loss decrease";

    labels_values(3,1) = to_string(double(minimum_loss_decrease));


    // Loss goal


    labels_values(4,0) = "Loss goal";

    labels_values(4,1) = to_string(double(training_loss_goal));


    // Maximum selection error increases


    labels_values(5,0) = "Maximum selection error increases";

    labels_values(5,1) = to_string(maximum_selection_failures);


    // Maximum epochs number


    labels_values(6,0) = "Maximum epochs number";

    labels_values(6,1) = to_string(maximum_epochs_number);


    // Maximum time


    labels_values(7,0) = "Maximum time";

    labels_values(7,1) = write_time(maximum_time);


    return labels_values;

}


void ConjugateGradient::write_XML(tinyxml2::XMLPrinter& file_stream) const

{

    ostringstream buffer;


    file_stream.OpenElement("ConjugateGradient");


    // Training direction method


    {

        file_stream.OpenElement("TrainingDirectionMethod");


        file_stream.PushText(write_training_direction_method().c_str());


        file_stream.CloseElement();

    }


    // Learning rate algorithm


    learning_rate_algorithm.write_XML(file_stream);


    // Minimum loss decrease


    {

        file_stream.OpenElement("MinimumLossDecrease");


        buffer.str("");

        buffer << minimum_loss_decrease;


        file_stream.PushText(buffer.str().c_str());


        file_stream.CloseElement();

    }


    // Loss goal


    {

        file_stream.OpenElement("LossGoal");


        buffer.str("");

        buffer << training_loss_goal;


        file_stream.PushText(buffer.str().c_str());


        file_stream.CloseElement();

    }


    // Maximum selection error increases

    {

        file_stream.OpenElement("MaximumSelectionErrorIncreases");


        buffer.str("");

        buffer << maximum_selection_failures;


        file_stream.PushText(buffer.str().c_str());


        file_stream.CloseElement();

    }


    // Maximum iterations number

    {

        file_stream.OpenElement("MaximumEpochsNumber");


        buffer.str("");

        buffer << maximum_epochs_number;


        file_stream.PushText(buffer.str().c_str());


        file_stream.CloseElement();

    }


    // Maximum time


    {

        file_stream.OpenElement("MaximumTime");


        buffer.str("");

        buffer << maximum_time;


        file_stream.PushText(buffer.str().c_str());


        file_stream.CloseElement();

    }


    // Hardware use

    {

        file_stream.OpenElement("HardwareUse");


        buffer.str("");

        buffer << hardware_use;


        file_stream.PushText(buffer.str().c_str());


        file_stream.CloseElement();

    }


    file_stream.CloseElement();

}


void ConjugateGradient::from_XML(const tinyxml2::XMLDocument& document)

{

    const tinyxml2::XMLElement* root_element = document.FirstChildElement("ConjugateGradient");


    if(!root_element)

    {

        ostringstream buffer;


        buffer << "OpenNN Exception: ConjugateGradient class.\n"

               << "void from_XML(const tinyxml2::XMLDocument&) method.\n"

               << "Conjugate gradient element is nullptr.\n";


        throw logic_error(buffer.str());

    }


    // Training direction method

    {

        const tinyxml2::XMLElement* training_direction_method_element = root_element->FirstChildElement("TrainingDirectionMethod");


        if(training_direction_method_element)

        {

            const string new_training_direction_method = training_direction_method_element->GetText();


            try

            {

                set_training_direction_method(new_training_direction_method);

            }

            catch(const logic_error& e)

            {

                cerr << e.what() << endl;

            }

        }

    }


    // Learning rate algorithm

    {

        const tinyxml2::XMLElement* learning_rate_algorithm_element = root_element->FirstChildElement("LearningRateAlgorithm");


        if(learning_rate_algorithm_element)

        {

            tinyxml2::XMLDocument learning_rate_algorithm_document;

            tinyxml2::XMLNode* element_clone;


            element_clone = learning_rate_algorithm_element->DeepClone(&learning_rate_algorithm_document);


            learning_rate_algorithm_document.InsertFirstChild(element_clone);


            learning_rate_algorithm.from_XML(learning_rate_algorithm_document);

        }

    }


    // Minimum loss decrease

    {

        const tinyxml2::XMLElement* minimum_loss_decrease_element = root_element->FirstChildElement("MinimumLossDecrease");


        if(minimum_loss_decrease_element)

        {

            const type new_minimum_loss_decrease = static_cast<type>(atof(minimum_loss_decrease_element->GetText()));


            try

            {

                set_minimum_loss_decrease(new_minimum_loss_decrease);

            }

            catch(const logic_error& e)

            {

                cerr << e.what() << endl;

            }

        }

    }


    // Loss goal

    {

        const tinyxml2::XMLElement* loss_goal_element = root_element->FirstChildElement("LossGoal");


        if(loss_goal_element)

        {

            const type new_loss_goal = static_cast<type>(atof(loss_goal_element->GetText()));


            try

            {

                set_loss_goal(new_loss_goal);

            }

            catch(const logic_error& e)

            {

                cerr << e.what() << endl;

            }

        }

    }


    // Maximum selection error increases

    {

        const tinyxml2::XMLElement* maximum_selection_failures_element = root_element->FirstChildElement("MaximumSelectionErrorIncreases");


        if(maximum_selection_failures_element)

        {

            const Index new_maximum_selection_failures = static_cast<Index>(atoi(maximum_selection_failures_element->GetText()));


            try

            {

                set_maximum_selection_failures(new_maximum_selection_failures);

            }

            catch(const logic_error& e)

            {

                cerr << e.what() << endl;

            }

        }

    }


    // Maximum epochs number

    {

        const tinyxml2::XMLElement* maximum_iterations_number_element = root_element->FirstChildElement("MaximumEpochsNumber");


        if(maximum_iterations_number_element)

        {

            const Index new_maximum_iterations_number = static_cast<Index>(atoi(maximum_iterations_number_element->GetText()));


            try

            {

                set_maximum_epochs_number(new_maximum_iterations_number);

            }

            catch(const logic_error& e)

            {

                cerr << e.what() << endl;

            }

        }

    }


    // Maximum time

    {

        const tinyxml2::XMLElement* maximum_time_element = root_element->FirstChildElement("MaximumTime");


        if(maximum_time_element)

        {

            const type new_maximum_time = static_cast<type>(atof(maximum_time_element->GetText()));


            try

            {

                set_maximum_time(new_maximum_time);

            }

            catch(const logic_error& e)

            {

                cerr << e.what() << endl;

            }

        }

    }


      // Display period

      {

         const tinyxml2::XMLElement* display_period_element = root_element->FirstChildElement("DisplayPeriod");


         if(display_period_element)

         {

            const Index new_display_period = static_cast<Index>(atoi(display_period_element->GetText()));


            try

            {

               set_display_period(new_display_period);

            }

            catch(const logic_error& e)

            {

               cerr << e.what() << endl;

            }

         }

      }


         // Save period

         {

             const tinyxml2::XMLElement* element = root_element->FirstChildElement("SavePeriod");


             if(element)

             {

                const Index new_save_period = static_cast<Index>(atoi(element->GetText()));


                try

                {

                   set_save_period(new_save_period);

                }

                catch(const logic_error& e)

                {

                   cerr << e.what() << endl;

                }

             }

         }


         // Neural network file name

         {

             const tinyxml2::XMLElement* element = root_element->FirstChildElement("NeuralNetworkFileName");


             if(element)

             {

                const string new_neural_network_file_name = element->GetText();


                try

                {

                   set_neural_network_file_name(new_neural_network_file_name);

                }

                catch(const logic_error& e)

                {

                   cerr << e.what() << endl;

                }

             }

         }


      // Display

      {

         const tinyxml2::XMLElement* display_element = root_element->FirstChildElement("Display");


         if(display_element)

         {

            const string new_display = display_element->GetText();


            try

            {

               set_display(new_display != "0");

            }

            catch(const logic_error& e)

            {

               cerr << e.what() << endl;

            }

         }

      }


    // Hardware use

    {

        const tinyxml2::XMLElement* element = root_element->FirstChildElement("HardwareUse");


        if(element)

        {

            const string new_hardware_use = element->GetText();


            try

            {

                set_hardware_use(new_hardware_use);

            }

            catch(const logic_error& e)

            {

                cerr << e.what() << endl;

            }

        }

    }

}


void ConjugateGradient::update_parameters(

        const DataSetBatch& batch,

        NeuralNetworkForwardPropagation& forward_propagation,

        LossIndexBackPropagation& back_propagation,

        ConjugateGradientData& optimization_data)

{

    const Index parameters_number = back_propagation.parameters.dimension(0);


    if(optimization_data.epoch == 0 || optimization_data.epoch % parameters_number == 0)

    {

        calculate_gradient_descent_training_direction(

                    back_propagation.gradient,

                    optimization_data.training_direction);

    }

    else

    {

        calculate_conjugate_gradient_training_direction(

                    optimization_data.old_gradient,

                    back_propagation.gradient,

                    optimization_data.old_training_direction,

                    optimization_data.training_direction);

    }


    optimization_data.training_slope.device(*thread_pool_device)

            = (back_propagation.gradient).contract(optimization_data.training_direction, AT_B);


    if(optimization_data.training_slope(0) >= type(0))

    {

        calculate_gradient_descent_training_direction(

                    back_propagation.gradient,

                    optimization_data.training_direction);

    }


    // Get initial learning rate


    optimization_data.epoch == 0

            ? optimization_data.initial_learning_rate = first_learning_rate

            : optimization_data.initial_learning_rate = optimization_data.old_learning_rate;


    pair<type,type> directional_point = learning_rate_algorithm.calculate_directional_point(

         batch,

         forward_propagation,

         back_propagation,

         optimization_data);


    optimization_data.learning_rate = directional_point.first;

    back_propagation.loss = directional_point.second;


    if(abs(optimization_data.learning_rate) > type(0))

    {

        optimization_data.parameters_increment.device(*thread_pool_device)

                = optimization_data.training_direction*optimization_data.learning_rate;


        back_propagation.parameters.device(*thread_pool_device) += optimization_data.parameters_increment;

    }

    else

    {

        const Index parameters_number = back_propagation.parameters.size();


        for(Index i = 0; i < parameters_number; i++)

        {

            if(abs(back_propagation.gradient(i)) < type(NUMERIC_LIMITS_MIN))

            {

                optimization_data.parameters_increment(i) = type(0);

            }

            else if(back_propagation.gradient(i) > type(0))

            {

                back_propagation.parameters(i) -= numeric_limits<type>::epsilon();;


                optimization_data.parameters_increment(i) = -numeric_limits<type>::epsilon();

            }

            else if(back_propagation.gradient(i) < type(0))

            {

                back_propagation.parameters(i) += numeric_limits<type>::epsilon();;


                optimization_data.parameters_increment(i) = numeric_limits<type>::epsilon();

            }

        }


        optimization_data.learning_rate = optimization_data.initial_learning_rate;

    }


    // Update stuff


    optimization_data.old_gradient = back_propagation.gradient;


    optimization_data.old_training_direction = optimization_data.training_direction;


    optimization_data.old_learning_rate = optimization_data.learning_rate;


    // Update parameters


    forward_propagation.neural_network_pointer->set_parameters(back_propagation.parameters);

}


ConjugateGradientData::ConjugateGradientData(): OptimizationAlgorithmData()

{

}


ConjugateGradientData::ConjugateGradientData(ConjugateGradient* new_conjugate_gradient_pointer) : OptimizationAlgorithmData()

{

    set(new_conjugate_gradient_pointer);

}


ConjugateGradientData::~ConjugateGradientData()

{


}


void ConjugateGradientData::set(ConjugateGradient* new_conjugate_gradient_pointer)

{

    conjugate_gradient_pointer = new_conjugate_gradient_pointer;


    LossIndex* loss_index_pointer = conjugate_gradient_pointer->get_loss_index_pointer();


    NeuralNetwork* neural_network_pointer = loss_index_pointer->get_neural_network_pointer();


    const Index parameters_number = neural_network_pointer->get_parameters_number();


    potential_parameters.resize(parameters_number);


    parameters_increment.resize(parameters_number);


    old_gradient.resize(parameters_number);


    training_direction.resize(parameters_number);

    old_training_direction.resize(parameters_number);

}


void ConjugateGradientData::print() const

{

}


}


// OpenNN: Open Neural Networks Library.

// Copyright(C) 2005-2021 Artificial Intelligence Techniques, SL.

//

// This library is free software; you can redistribute it and/or

// modify it under the terms of the GNU Lesser General Public

// License as published by the Free Software Foundation; either

// version 2.1 of the License, or any later version.

//

// This library is distributed in the hope that it will be useful,

// but WITHOUT ANY WARRANTY; without even the implied warranty of

// MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU

// Lesser General Public License for more details.


// You should have received a copy of the GNU Lesser General Public

// License along with this library; if not, write to the Free Software

// Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA

OpenNN::ConjugateGradient
Definition: conjugate_gradient.h:46

OpenNN::ConjugateGradient::perform_training
TrainingResults perform_training()
Definition: conjugate_gradient.cpp:715

OpenNN::ConjugateGradient::set_maximum_selection_failures
void set_maximum_selection_failures(const Index &)
Definition: conjugate_gradient.cpp:257

OpenNN::ConjugateGradient::calculate_FR_training_direction
void calculate_FR_training_direction(const Tensor< type, 1 > &, const Tensor< type, 1 > &, const Tensor< type, 1 > &, Tensor< type, 1 > &) const
Definition: conjugate_gradient.cpp:561

OpenNN::ConjugateGradient::set_loss_index_pointer
void set_loss_index_pointer(LossIndex *)
Definition: conjugate_gradient.cpp:133

OpenNN::ConjugateGradient::get_maximum_time
const type & get_maximum_time() const
Returns the maximum training time.
Definition: conjugate_gradient.cpp:123

OpenNN::ConjugateGradient::ConjugateGradient
ConjugateGradient()
Definition: conjugate_gradient.cpp:19

OpenNN::ConjugateGradient::get_loss_goal
const type & get_loss_goal() const
Definition: conjugate_gradient.cpp:99

OpenNN::ConjugateGradient::from_XML
void from_XML(const tinyxml2::XMLDocument &)
Definition: conjugate_gradient.cpp:1086

OpenNN::ConjugateGradient::set_default
void set_default()
Definition: conjugate_gradient.cpp:216

OpenNN::ConjugateGradient::get_maximum_epochs_number
const Index & get_maximum_epochs_number() const
Returns the maximum number of epochs for training.
Definition: conjugate_gradient.cpp:115

OpenNN::ConjugateGradient::to_string_matrix
Tensor< string, 2 > to_string_matrix() const
Writes as matrix of strings the most representative atributes.
Definition: conjugate_gradient.cpp:933

OpenNN::ConjugateGradient::minimum_loss_decrease
type minimum_loss_decrease
Minimum loss improvement between two successive iterations. It is used as a stopping criterion.
Definition: conjugate_gradient.h:164

OpenNN::ConjugateGradient::get_learning_rate_algorithm_pointer
LearningRateAlgorithm * get_learning_rate_algorithm_pointer()
Returns a pointer to the learning rate algorithm object inside the conjugate gradient method object.
Definition: conjugate_gradient.cpp:57

OpenNN::ConjugateGradient::calculate_conjugate_gradient_training_direction
void calculate_conjugate_gradient_training_direction(const Tensor< type, 1 > &, const Tensor< type, 1 > &, const Tensor< type, 1 > &, Tensor< type, 1 > &) const
Definition: conjugate_gradient.cpp:641

OpenNN::ConjugateGradient::write_optimization_algorithm_type
string write_optimization_algorithm_type() const
Write a string with best algorithm type for the model.
Definition: conjugate_gradient.cpp:925

OpenNN::ConjugateGradient::get_learning_rate_algorithm
const LearningRateAlgorithm & get_learning_rate_algorithm() const
Returns a constant reference to the learning rate algorithm object inside the conjugate gradient meth...
Definition: conjugate_gradient.cpp:49

OpenNN::ConjugateGradient::set_save_period
void set_save_period(const Index &)
Definition: conjugate_gradient.cpp:302

OpenNN::ConjugateGradient::set_maximum_time
void set_maximum_time(const type &)
Definition: conjugate_gradient.cpp:275

OpenNN::ConjugateGradient::learning_rate_algorithm
LearningRateAlgorithm learning_rate_algorithm
Learning rate algorithm object for one-dimensional minimization.
Definition: conjugate_gradient.h:158

OpenNN::ConjugateGradient::set_loss_goal
void set_loss_goal(const type &)
Definition: conjugate_gradient.cpp:248

OpenNN::ConjugateGradient::calculate_PR_parameter
type calculate_PR_parameter(const Tensor< type, 1 > &, const Tensor< type, 1 > &) const
Definition: conjugate_gradient.cpp:409

OpenNN::ConjugateGradient::set_training_direction_method
void set_training_direction_method(const TrainingDirectionMethod &)
Definition: conjugate_gradient.cpp:145

OpenNN::ConjugateGradient::maximum_time
type maximum_time
Maximum training time. It is used as a stopping criterion.
Definition: conjugate_gradient.h:181

OpenNN::ConjugateGradient::set_maximum_epochs_number
void set_maximum_epochs_number(const Index &)
Definition: conjugate_gradient.cpp:266

OpenNN::ConjugateGradient::set_minimum_loss_decrease
void set_minimum_loss_decrease(const type &)
Definition: conjugate_gradient.cpp:238

OpenNN::ConjugateGradient::TrainingDirectionMethod
TrainingDirectionMethod
Enumeration of the available training operators for obtaining the training direction.
Definition: conjugate_gradient.h:54

OpenNN::ConjugateGradient::~ConjugateGradient
virtual ~ConjugateGradient()
Destructor.
Definition: conjugate_gradient.cpp:42

OpenNN::ConjugateGradient::calculate_FR_parameter
type calculate_FR_parameter(const Tensor< type, 1 > &, const Tensor< type, 1 > &) const
Definition: conjugate_gradient.cpp:327

OpenNN::ConjugateGradient::training_loss_goal
type training_loss_goal
Goal value for the loss. It is used as a stopping criterion.
Definition: conjugate_gradient.h:168

OpenNN::ConjugateGradient::maximum_epochs_number
Index maximum_epochs_number
Maximum number of epochs to perform_training. It is used as a stopping criterion.
Definition: conjugate_gradient.h:177

OpenNN::ConjugateGradient::write_XML
void write_XML(tinyxml2::XMLPrinter &) const
Definition: conjugate_gradient.cpp:984

OpenNN::ConjugateGradient::get_maximum_selection_failures
const Index & get_maximum_selection_failures() const
Returns the maximum number of selection error increases during the training process.
Definition: conjugate_gradient.cpp:107

OpenNN::ConjugateGradient::maximum_selection_failures
Index maximum_selection_failures
Definition: conjugate_gradient.h:173

OpenNN::ConjugateGradient::calculate_PR_training_direction
void calculate_PR_training_direction(const Tensor< type, 1 > &, const Tensor< type, 1 > &, const Tensor< type, 1 > &, Tensor< type, 1 > &) const
Definition: conjugate_gradient.cpp:492

OpenNN::ConjugateGradient::write_training_direction_method
string write_training_direction_method() const
Returns a string with the name of the training direction.
Definition: conjugate_gradient.cpp:73

OpenNN::ConjugateGradient::training_direction_method
TrainingDirectionMethod training_direction_method
Applied method for calculating the conjugate gradient direction.
Definition: conjugate_gradient.h:154

OpenNN::ConjugateGradient::update_parameters
void update_parameters(const DataSetBatch &batch, NeuralNetworkForwardPropagation &forward_propagation, LossIndexBackPropagation &back_propagation, ConjugateGradientData &optimization_data)
ConjugateGradient::update_parameters.
Definition: conjugate_gradient.cpp:1335

OpenNN::ConjugateGradient::get_training_direction_method
const TrainingDirectionMethod & get_training_direction_method() const
Returns the conjugate gradient training direction method used for training.
Definition: conjugate_gradient.cpp:65

OpenNN::ConjugateGradient::get_minimum_loss_decrease
const type & get_minimum_loss_decrease() const
Returns the minimum loss improvement during training.
Definition: conjugate_gradient.cpp:90

OpenNN::DataSet
This class represents the concept of data set for data modelling problems, such as approximation,...
Definition: data_set.h:57

OpenNN::DataSet::get_training_samples_number
Index get_training_samples_number() const
Returns the number of samples in the data set which will be used for training.
Definition: data_set.cpp:1382

OpenNN::DataSet::scale_target_variables
Tensor< Descriptives, 1 > scale_target_variables()
Definition: data_set.cpp:6298

OpenNN::DataSet::get_training_samples_indices
Tensor< Index, 1 > get_training_samples_indices() const
Returns the indices of the samples which will be used for training.
Definition: data_set.cpp:1073

OpenNN::DataSet::get_selection_samples_indices
Tensor< Index, 1 > get_selection_samples_indices() const
Returns the indices of the samples which will be used for selection.
Definition: data_set.cpp:1098

OpenNN::DataSet::unscale_input_variables
void unscale_input_variables(const Tensor< Descriptives, 1 > &)
Definition: data_set.cpp:6351

OpenNN::DataSet::get_target_variables_indices
Tensor< Index, 1 > get_target_variables_indices() const
Returns the indices of the target variables.
Definition: data_set.cpp:3094

OpenNN::DataSet::get_selection_samples_number
Index get_selection_samples_number() const
Returns the number of samples in the data set which will be used for selection.
Definition: data_set.cpp:1402

OpenNN::DataSet::unscale_target_variables
void unscale_target_variables(const Tensor< Descriptives, 1 > &)
Definition: data_set.cpp:6397

OpenNN::DataSet::get_target_variables_names
Tensor< string, 1 > get_target_variables_names() const
Definition: data_set.cpp:2215

OpenNN::DataSet::get_input_variables_indices
Tensor< Index, 1 > get_input_variables_indices() const
Returns the indices of the input variables.
Definition: data_set.cpp:3047

OpenNN::DataSet::get_input_variables_names
Tensor< string, 1 > get_input_variables_names() const
Definition: data_set.cpp:2184

OpenNN::DataSet::scale_input_variables
Tensor< Descriptives, 1 > scale_input_variables()
Definition: data_set.cpp:6243

OpenNN::LearningRateAlgorithm
A learning rate that is adjusted according to an algorithm during training to minimize training time.
Definition: learning_rate_algorithm.h:41

OpenNN::LearningRateAlgorithm::set_loss_index_pointer
void set_loss_index_pointer(LossIndex *)
Definition: learning_rate_algorithm.cpp:175

OpenNN::LearningRateAlgorithm::from_XML
void from_XML(const tinyxml2::XMLDocument &)
Definition: learning_rate_algorithm.cpp:730

OpenNN::LearningRateAlgorithm::write_learning_rate_method
string write_learning_rate_method() const
Returns a string with the name of the learning rate method to be used.
Definition: learning_rate_algorithm.cpp:97

OpenNN::LearningRateAlgorithm::calculate_directional_point
pair< type, type > calculate_directional_point(const DataSetBatch &, NeuralNetworkForwardPropagation &, LossIndexBackPropagation &, OptimizationAlgorithmData &) const
Definition: learning_rate_algorithm.cpp:268

OpenNN::LearningRateAlgorithm::write_XML
void write_XML(tinyxml2::XMLPrinter &) const
Definition: learning_rate_algorithm.cpp:693

OpenNN::LossIndex
This abstract class represents the concept of loss index composed of an error term and a regularizati...
Definition: loss_index.h:48

OpenNN::LossIndex::get_neural_network_pointer
NeuralNetwork * get_neural_network_pointer() const
Returns a pointer to the neural network object associated to the error term.
Definition: loss_index.h:70

OpenNN::LossIndex::get_data_set_pointer
DataSet * get_data_set_pointer() const
Returns a pointer to the data set object associated to the error term.
Definition: loss_index.h:92

OpenNN::NeuralNetwork
Definition: neural_network.h:47

OpenNN::NeuralNetwork::get_scaling_layer_pointer
ScalingLayer * get_scaling_layer_pointer() const
Returns a pointer to the scaling layers object composing this neural network object.
Definition: neural_network.cpp:473

OpenNN::NeuralNetwork::has_scaling_layer
bool has_scaling_layer() const
Definition: neural_network.cpp:221

OpenNN::NeuralNetwork::has_unscaling_layer
bool has_unscaling_layer() const
Definition: neural_network.cpp:285

OpenNN::NeuralNetwork::forward_propagate
void forward_propagate(const DataSetBatch &, NeuralNetworkForwardPropagation &) const
Calculate forward propagation in neural network.
Definition: neural_network.cpp:1373

OpenNN::NeuralNetwork::save
void save(const string &) const
Definition: neural_network.cpp:2371

OpenNN::NeuralNetwork::set_parameters
void set_parameters(Tensor< type, 1 > &)
Definition: neural_network.cpp:1135

OpenNN::NeuralNetwork::get_unscaling_layer_pointer
UnscalingLayer * get_unscaling_layer_pointer() const
Returns a pointer to the unscaling layers object composing this neural network object.
Definition: neural_network.cpp:497

OpenNN::NeuralNetwork::get_parameters_number
Index get_parameters_number() const
Definition: neural_network.cpp:1044

OpenNN::OptimizationAlgorithm
Definition: optimization_algorithm.h:42

OpenNN::OptimizationAlgorithm::set_display_period
void set_display_period(const Index &)
Definition: optimization_algorithm.cpp:185

OpenNN::OptimizationAlgorithm::neural_network_file_name
string neural_network_file_name
Path where the neural network is saved.
Definition: optimization_algorithm.h:150

OpenNN::OptimizationAlgorithm::set_hardware_use
void set_hardware_use(const string &)
Set hardware to use. Default: Multi-core.
Definition: optimization_algorithm.cpp:85

OpenNN::OptimizationAlgorithm::set_neural_network_file_name
void set_neural_network_file_name(const string &)
Definition: optimization_algorithm.cpp:235

OpenNN::OptimizationAlgorithm::loss_index_pointer
LossIndex * loss_index_pointer
Pointer to a loss index for a neural network object.
Definition: optimization_algorithm.h:128

OpenNN::OptimizationAlgorithm::check
virtual void check() const
Definition: optimization_algorithm.cpp:260

OpenNN::OptimizationAlgorithm::display
bool display
Display messages to screen.
Definition: optimization_algorithm.h:154

OpenNN::OptimizationAlgorithm::write_time
const string write_time(const type &) const
Writes the time from seconds in format HH:mm:ss.
Definition: optimization_algorithm.cpp:483

OpenNN::OptimizationAlgorithm::save_period
Index save_period
Number of iterations between the training saving progress.
Definition: optimization_algorithm.h:146

OpenNN::OptimizationAlgorithm::hardware_use
string hardware_use
Hardware use.
Definition: optimization_algorithm.h:138

OpenNN::OptimizationAlgorithm::set_display
virtual void set_display(const bool &)
Definition: optimization_algorithm.cpp:175

OpenNN::OptimizationAlgorithm::get_loss_index_pointer
LossIndex * get_loss_index_pointer() const
Definition: optimization_algorithm.cpp:54

OpenNN::OptimizationAlgorithm::display_period
Index display_period
Number of iterations between the training showing progress.
Definition: optimization_algorithm.h:142

OpenNN::ScalingLayer
This class represents a layer of scaling neurons.
Definition: scaling_layer.h:38

OpenNN::ScalingLayer::set
void set()
Sets the scaling layer to be empty.
Definition: scaling_layer.cpp:290

OpenNN::UnscalingLayer
This class represents a layer of unscaling neurons.
Definition: unscaling_layer.h:40

OpenNN::UnscalingLayer::set
void set()
Sets the unscaling layer to be empty.
Definition: unscaling_layer.cpp:273

tinyxml2::XMLDocument
Definition: tinyxml2.h:1653

tinyxml2::XMLElement
Definition: tinyxml2.h:1243

tinyxml2::XMLNode
Definition: tinyxml2.h:663

tinyxml2::XMLPrinter
Definition: tinyxml2.h:2154

tinyxml2::XMLPrinter::PushText
void PushText(const char *text, bool cdata=false)
Add a text node.
Definition: tinyxml2.cpp:2878

tinyxml2::XMLPrinter::CloseElement
virtual void CloseElement(bool compactMode=false)
If streaming, close the Element.
Definition: tinyxml2.cpp:2834

half_float::abs
HALF_CONSTEXPR half abs(half arg)
Definition: half.hpp:2735

OpenNN::ConjugateGradientData
Definition: conjugate_gradient.h:186

OpenNN::ConjugateGradientData::ConjugateGradientData
ConjugateGradientData()
Default constructor.
Definition: conjugate_gradient.cpp:1431

OpenNN::DataSetBatch
Definition: data_set.h:887

OpenNN::LossIndexBackPropagation
Definition: loss_index.h:290

OpenNN::NeuralNetworkForwardPropagation
Definition: neural_network.h:262

OpenNN::OptimizationAlgorithmData
Definition: optimization_algorithm.h:168

OpenNN::TrainingResults
This structure contains the optimization algorithm results.
Definition: optimization_algorithm.h:198

OpenNN::TrainingResults::selection_error_history
Tensor< type, 1 > selection_error_history
History of the selection error over the training iterations.
Definition: optimization_algorithm.h:279

OpenNN::TrainingResults::resize_training_error_history
void resize_training_error_history(const Index &)
Resizes the training error history keeping the values.
Definition: optimization_algorithm.cpp:438

OpenNN::TrainingResults::stopping_condition
OptimizationAlgorithm::StoppingCondition stopping_condition
Stopping condition of the algorithm.
Definition: optimization_algorithm.h:257

OpenNN::TrainingResults::resize_selection_error_history
void resize_selection_error_history(const Index &)
Resizes the selection error history keeping the values.
Definition: optimization_algorithm.cpp:461

OpenNN::TrainingResults::training_error_history
Tensor< type, 1 > training_error_history
History of the loss function loss over the training iterations.
Definition: optimization_algorithm.h:275

OpenNN::TrainingResults::elapsed_time
string elapsed_time
Elapsed time of the training process.
Definition: optimization_algorithm.h:283