documentation/reference/convolutional__layer_8h_source.html

//   OpenNN: Open Neural Networks Library

//   www.opennn.net

//

//   C O N V O L U T I O N A L   L A Y E R   C L A S S   H E A D E R

//

//   Artificial Intelligence Techniques SL

//   artelnics@artelnics.com


#ifndef CONVOLUTIONALLAYER_H

#define CONVOLUTIONALLAYER_H


// System includes


#include <cmath>

#include <cstdlib>

#include <fstream>

#include <iostream>

#include <string>

#include <sstream>

#include <ctype.h>

#include <stdexcept>


// OpenNN includes


#include "layer.h"

#include "config.h"


namespace OpenNN

{


struct ConvolutionalLayerForwardPropagation;

struct ConvolutionalLayerBackPropagation;


class PoolingLayer;

class PerceptronLayer;

class ProbabilisticLayer;


class ConvolutionalLayer : public Layer

{


public:


    enum class ActivationFunction{Threshold, SymmetricThreshold, Logistic, HyperbolicTangent, Linear, RectifiedLinear, ExponentialLinear, ScaledExponentialLinear, SoftPlus, SoftSign, HardSigmoid};


    enum class ConvolutionType{Valid, Same};


    // Constructors


    explicit ConvolutionalLayer();


    explicit ConvolutionalLayer(const Tensor<Index, 1>&, const Tensor<Index, 1>&);


    // Destructor


    // Get methods


    bool is_empty() const;


    const Tensor<type, 1>& get_biases() const;


    const Tensor<type, 4>& get_synaptic_weights() const;


    Index get_synaptic_weights_number() const;


    ActivationFunction get_activation_function() const;


    Tensor<Index, 1> get_outputs_dimensions() const;


    Tensor<Index, 1> get_input_variables_dimensions() const;


    Index get_outputs_rows_number() const;


    Index get_outputs_columns_number() const;


    ConvolutionType get_convolution_type() const;


    Index get_column_stride() const;


    Index get_row_stride() const;


    Index get_kernels_number() const;

    Index get_kernels_channels_number() const;

    Index get_kernels_rows_number() const;

    Index get_kernels_columns_number() const;


    Index get_padding_width() const;

    Index get_padding_height() const;


    Index get_inputs_channels_number() const;

    Index get_inputs_rows_number() const;

    Index get_inputs_columns_number() const;


    Index get_inputs_number() const;

    Index get_neurons_number() const;


    Tensor<type, 1> get_parameters() const;

    Index get_parameters_number() const;


    // Set methods


    void set(const Tensor<Index, 1>&, const Tensor<Index, 1>&);


    void set(const Tensor<type, 4>&, const Tensor<type, 4>&, const Tensor<type, 1>&);


    void set_activation_function(const ActivationFunction&);


    void set_biases(const Tensor<type, 1>&);


    void set_synaptic_weights(const Tensor<type, 4>&);


    void set_convolution_type(const ConvolutionType&);


    void set_parameters(const Tensor<type, 1>&, const Index& index);


    void set_row_stride(const Index&);


    void set_column_stride(const Index&);


    // Initialization


    void set_biases_constant(const type&);


    void set_synaptic_weights_constant(const type&);


    void set_parameters_constant(const type&);


    void set_parameters_random();


    // Padding


    void insert_padding(const Tensor<type, 4>&, Tensor<type, 4>&);


    // Combinations


    void calculate_convolutions(const Tensor<type, 4>&, Tensor<type, 4>&) const;


    void calculate_convolutions(const Tensor<type, 4>&,

                                const Tensor<type, 2>&,

                                const Tensor<type, 4>&,

                                Tensor<type, 4>&) const;


    // Activation


    void calculate_activations(const Tensor<type, 4>&, Tensor<type, 4>&) const;


    void calculate_activations_derivatives(const Tensor<type, 4>&, Tensor<type, 4>&, Tensor<type, 4>&) const;


   // Outputs


   void calculate_outputs(const Tensor<type, 4>&, Tensor<type, 4>&);


   void forward_propagate(const Tensor<type, 4>&, LayerForwardPropagation*);

   void forward_propagate(const Tensor<type, 2>&, LayerForwardPropagation*);


   void forward_propagate(const Tensor<type, 4>&, Tensor<type, 1>, LayerForwardPropagation*);

   void forward_propagate(const Tensor<type, 2>&, Tensor<type, 1>, LayerForwardPropagation*);


   // Delta methods


   void calculate_hidden_delta(Layer*,

                               LayerForwardPropagation*,

                               const Tensor<type, 2>&,

                               Tensor<type, 2>&) const;


   void calculate_hidden_delta_convolutional(ConvolutionalLayer*,

                                             const Tensor<type, 4>&,

                                             const Tensor<type, 4>&,

                                             const Tensor<type, 4>&,

                                             Tensor<type, 2>&) const;


   void calculate_hidden_delta_pooling(PoolingLayer*,

                                       const Tensor<type, 4>&,

                                       const Tensor<type, 4>&,

                                       const Tensor<type, 2>&,

                                       Tensor<type, 2>&) const;


   void calculate_hidden_delta_perceptron(const PerceptronLayer*,

                                          const Tensor<type, 4>&,

                                          const Tensor<type, 2>&,

                                          const Tensor<type, 2>&,

                                          Tensor<type, 2>&) const;


   void calculate_hidden_delta_probabilistic(ProbabilisticLayer*,

                                             const Tensor<type, 4>&,

                                             const Tensor<type, 4>&,

                                             const Tensor<type, 2>&,

                                             Tensor<type, 2>&) const;


   // Gradient methods


   void calculate_error_gradient(const Tensor<type, 4>&,

                                 LayerForwardPropagation*,

                                 LayerBackPropagation&) const;


   void calculate_error_gradient(const Tensor<type, 2>&,

                                 LayerForwardPropagation*,

                                 LayerBackPropagation&) const;


   void insert_gradient(LayerBackPropagation*,

                        const Index&,

                        Tensor<type, 1>&) const;


   void to_2d(const Tensor<type, 4>&, Tensor<type, 2>&) const;


protected:


   Tensor<type, 4> synaptic_weights;


   Tensor<type, 1> biases;


   Index row_stride = 1;


   Index column_stride = 1;


   Tensor<Index, 1> input_variables_dimensions;


   ConvolutionType convolution_type = ConvolutionType::Valid;


   ActivationFunction activation_function = ActivationFunction::RectifiedLinear;


#ifdef OPENNN_CUDA

    #include "../../opennn-cuda/opennn-cuda/convolutional_layer_cuda.h"

#endif


};


struct ConvolutionalLayerForwardPropagation : LayerForwardPropagation

{

    // Default constructor


    explicit ConvolutionalLayerForwardPropagation()

        : LayerForwardPropagation()

    {

    }


    // Constructor


    explicit ConvolutionalLayerForwardPropagation(const Index& new_batch_samples_number, Layer* new_layer_pointer)

        : LayerForwardPropagation()

    {

        set(new_batch_samples_number, new_layer_pointer);

    }


    void set(const Index& new_batch_samples_number, Layer* new_layer_pointer)

    {

        layer_pointer = new_layer_pointer;


        const Index neurons_number = layer_pointer->get_neurons_number();


        const Index kernels_number = static_cast<ConvolutionalLayer*>(layer_pointer)->get_kernels_number();

        const Index outputs_rows_number = static_cast<ConvolutionalLayer*>(layer_pointer)->get_outputs_rows_number();

        const Index outputs_columns_number = static_cast<ConvolutionalLayer*>(layer_pointer)->get_outputs_columns_number();


        batch_samples_number = new_batch_samples_number;


        combinations.resize(batch_samples_number, kernels_number, outputs_rows_number, outputs_columns_number);

        activations.resize(batch_samples_number, kernels_number, outputs_rows_number, outputs_columns_number);


        activations_derivatives.resize(batch_samples_number, neurons_number, neurons_number, neurons_number);

    }


    void print() const

    {


    }


    Tensor<type, 4> combinations;

    Tensor<type, 4> activations;

    Tensor<type, 4> activations_derivatives;

};


struct ConvolutionalLayerBackPropagation : LayerBackPropagation

{

    const Index neurons_number = layer_pointer->get_neurons_number();

    const Index inputs_nmumber = layer_pointer->get_inputs_number();


    explicit ConvolutionalLayerBackPropagation() : LayerBackPropagation()

    {

    }


    explicit ConvolutionalLayerBackPropagation(const Index& new_batch_samples_number, Layer* new_layer_pointer)

        : LayerBackPropagation()

    {

        set(new_batch_samples_number, new_layer_pointer);

    }


    void set(const Index& new_batch_samples_number, Layer* new_layer_pointer)

    {

    }


    void print() const

    {

    }


    Tensor<type, 4> delta;


    Tensor<type, 4> biases_derivatives;


    Tensor<type, 4> synaptic_weights_derivatives;

};


}


#endif


// OpenNN: Open Neural Networks Library.

// Copyright(C) 2005-2021 Artificial Intelligence Techniques, SL.

//

// This library is free software; you can redistribute it and/or

// modify it under the terms of the GNU Lesser General Public

// License as published by the Free Software Foundation; either

// version 2.1 of the License, or any later version.

//

// This library is distributed in the hope that it will be useful,

// but WITHOUT ANY WARRANTY; without even the implied warranty of

// MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU

// Lesser General Public License for more details.


// You should have received a copy of the GNU Lesser General Public

// License along with this library; if not, write to the Free Software


// Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA

OpenNN::ConvolutionalLayer
Definition: convolutional_layer.h:39

OpenNN::ConvolutionalLayer::get_input_variables_dimensions
Tensor< Index, 1 > get_input_variables_dimensions() const
Returns the dimension of the input variables.
Definition: convolutional_layer.cpp:923

OpenNN::ConvolutionalLayer::set_parameters_constant
void set_parameters_constant(const type &)
Definition: convolutional_layer.cpp:1210

OpenNN::ConvolutionalLayer::get_synaptic_weights_number
Index get_synaptic_weights_number() const
Returns the number of layer's synaptic weights.
Definition: convolutional_layer.cpp:1347

OpenNN::ConvolutionalLayer::get_column_stride
Index get_column_stride() const
Returns the column stride.
Definition: convolutional_layer.cpp:939

OpenNN::ConvolutionalLayer::get_inputs_number
Index get_inputs_number() const
Returns the number of inputs.
Definition: convolutional_layer.cpp:1029

OpenNN::ConvolutionalLayer::get_kernels_number
Index get_kernels_number() const
Returns the number of kernels of the layer.
Definition: convolutional_layer.cpp:955

OpenNN::ConvolutionalLayer::get_outputs_rows_number
Index get_outputs_rows_number() const
Returns the number of rows the result of applying the layer's kernels to an image will have.
Definition: convolutional_layer.cpp:884

OpenNN::ConvolutionalLayer::set_biases_constant
void set_biases_constant(const type &)
Definition: convolutional_layer.cpp:1192

OpenNN::ConvolutionalLayer::synaptic_weights
Tensor< type, 4 > synaptic_weights
This tensor containing conection strengths from a layer's inputs to its neurons.
Definition: convolutional_layer.h:212

OpenNN::ConvolutionalLayer::get_inputs_channels_number
Index get_inputs_channels_number() const
Returns the number of channels of the input.
Definition: convolutional_layer.cpp:1355

OpenNN::ConvolutionalLayer::get_kernels_channels_number
Index get_kernels_channels_number() const
Returns the number of channels of the layer's kernels.
Definition: convolutional_layer.cpp:963

OpenNN::ConvolutionalLayer::ActivationFunction
ActivationFunction
Enumeration of available activation functions for the convolutional layer.
Definition: convolutional_layer.h:45

OpenNN::ConvolutionalLayer::is_empty
bool is_empty() const
Returns a boolean, true if convolutional layer is empty and false otherwise.
Definition: convolutional_layer.cpp:46

OpenNN::ConvolutionalLayer::set_synaptic_weights
void set_synaptic_weights(const Tensor< type, 4 > &)
Definition: convolutional_layer.cpp:1249

OpenNN::ConvolutionalLayer::get_inputs_rows_number
Index get_inputs_rows_number() const
Returns the number of rows of the input.
Definition: convolutional_layer.cpp:1363

OpenNN::ConvolutionalLayer::set_activation_function
void set_activation_function(const ActivationFunction &)
Definition: convolutional_layer.cpp:1231

OpenNN::ConvolutionalLayer::ConvolutionalLayer
ConvolutionalLayer()
Definition: convolutional_layer.cpp:22

OpenNN::ConvolutionalLayer::get_inputs_columns_number
Index get_inputs_columns_number() const
Returns the number of columns of the input.
Definition: convolutional_layer.cpp:1371

OpenNN::ConvolutionalLayer::biases
Tensor< type, 1 > biases
Definition: convolutional_layer.h:217

OpenNN::ConvolutionalLayer::set_row_stride
void set_row_stride(const Index &)
Definition: convolutional_layer.cpp:1267

OpenNN::ConvolutionalLayer::set
void set(const Tensor< Index, 1 > &, const Tensor< Index, 1 > &)
Definition: convolutional_layer.cpp:1100

OpenNN::ConvolutionalLayer::insert_padding
void insert_padding(const Tensor< type, 4 > &, Tensor< type, 4 > &)
Definition: convolutional_layer.cpp:59

OpenNN::ConvolutionalLayer::get_biases
const Tensor< type, 1 > & get_biases() const
Returns the layer's biases.
Definition: convolutional_layer.cpp:1331

OpenNN::ConvolutionalLayer::get_outputs_columns_number
Index get_outputs_columns_number() const
Returns the number of columns the result of applying the layer's kernels to an image will have.
Definition: convolutional_layer.cpp:896

OpenNN::ConvolutionalLayer::set_column_stride
void set_column_stride(const Index &)
Definition: convolutional_layer.cpp:1281

OpenNN::ConvolutionalLayer::get_padding_width
Index get_padding_width() const
Returns the total number of columns of zeroes to be added to an image before applying a kernel,...
Definition: convolutional_layer.cpp:987

OpenNN::ConvolutionalLayer::get_neurons_number
Index get_neurons_number() const
Returns the number of neurons.
Definition: convolutional_layer.cpp:1037

OpenNN::ConvolutionalLayer::get_convolution_type
ConvolutionType get_convolution_type() const
Returns the padding option.
Definition: convolutional_layer.cpp:931

OpenNN::ConvolutionalLayer::set_biases
void set_biases(const Tensor< type, 1 > &)
Definition: convolutional_layer.cpp:1240

OpenNN::ConvolutionalLayer::get_kernels_rows_number
Index get_kernels_rows_number() const
Returns the number of rows of the layer's kernels.
Definition: convolutional_layer.cpp:971

OpenNN::ConvolutionalLayer::get_outputs_dimensions
Tensor< Index, 1 > get_outputs_dimensions() const
Returns a vector containing the number of channels, rows and columns of the result of applying the la...
Definition: convolutional_layer.cpp:908

OpenNN::ConvolutionalLayer::calculate_activations
void calculate_activations(const Tensor< type, 4 > &, Tensor< type, 4 > &) const
Calculates activations.
Definition: convolutional_layer.cpp:134

OpenNN::ConvolutionalLayer::get_activation_function
ActivationFunction get_activation_function() const
Returns the convolutional layer's activation function.
Definition: convolutional_layer.cpp:876

OpenNN::ConvolutionalLayer::get_row_stride
Index get_row_stride() const
Returns the row stride.
Definition: convolutional_layer.cpp:947

OpenNN::ConvolutionalLayer::set_synaptic_weights_constant
void set_synaptic_weights_constant(const type &)
Definition: convolutional_layer.cpp:1201

OpenNN::ConvolutionalLayer::get_padding_height
Index get_padding_height() const
Returns the total number of rows of zeroes to be added to an image before applying a kernel,...
Definition: convolutional_layer.cpp:1008

OpenNN::ConvolutionalLayer::get_synaptic_weights
const Tensor< type, 4 > & get_synaptic_weights() const
Returns the layer's synaptic weights.
Definition: convolutional_layer.cpp:1339

OpenNN::ConvolutionalLayer::get_kernels_columns_number
Index get_kernels_columns_number() const
Returns the number of columns of the layer's kernels.
Definition: convolutional_layer.cpp:979

OpenNN::ConvolutionalLayer::set_convolution_type
void set_convolution_type(const ConvolutionType &)
Definition: convolutional_layer.cpp:1258

OpenNN::ConvolutionalLayer::calculate_convolutions
void calculate_convolutions(const Tensor< type, 4 > &, Tensor< type, 4 > &) const
Calculate convolutions.
Definition: convolutional_layer.cpp:82

OpenNN::ConvolutionalLayer::get_parameters_number
Index get_parameters_number() const
Returns the number of parameters of the layer.
Definition: convolutional_layer.cpp:1089

OpenNN::ConvolutionalLayer::calculate_hidden_delta_perceptron
void calculate_hidden_delta_perceptron(const PerceptronLayer *, const Tensor< type, 4 > &, const Tensor< type, 2 > &, const Tensor< type, 2 > &, Tensor< type, 2 > &) const
Definition: convolutional_layer.cpp:649

OpenNN::ConvolutionalLayer::calculate_outputs
void calculate_outputs(const Tensor< type, 4 > &, Tensor< type, 4 > &)
Definition: convolutional_layer.cpp:198

OpenNN::ConvolutionalLayer::set_parameters
void set_parameters(const Tensor< type, 1 > &, const Index &index)
Definition: convolutional_layer.cpp:1295

OpenNN::ConvolutionalLayer::get_parameters
Tensor< type, 1 > get_parameters() const
Returns the layer's parameters in the form of a vector.
Definition: convolutional_layer.cpp:1049

OpenNN::Layer
This abstract class represents the concept of layer of neurons in OpenNN.
Definition: layer.h:53

OpenNN::ConvolutionalLayerBackPropagation
Definition: convolutional_layer.h:286

OpenNN::ConvolutionalLayerForwardPropagation
Definition: convolutional_layer.h:237

OpenNN::LayerBackPropagation
Definition: layer.h:302

OpenNN::LayerBackPropagation::LayerBackPropagation
LayerBackPropagation()
Default constructor.
Definition: layer.h:305

OpenNN::LayerForwardPropagation
Definition: layer.h:282

OpenNN::LayerForwardPropagation::LayerForwardPropagation
LayerForwardPropagation()
Default constructor.
Definition: layer.h:285