documentation/reference/configuration_8h_source.html

//   OpenNN: Open Neural Networks Library

//   www.opennn.net

//

//   C O N F I G U R A T I O N

//

//   Artificial Intelligence Techniques SL

//   artelnics@artelnics.com


#pragma once


#include "pch.h"


namespace opennn

{


enum class Device { Auto, CPU, CUDA };


enum class Type { Auto, FP32, BF16, INT8 };


template<Type T> struct TypeInfo;


template<> struct TypeInfo<Type::FP32>

{

    using type = float;

    static constexpr cudnnDataType_t cudnn = CUDNN_DATA_FLOAT;

    static constexpr cudaDataType_t  cuda  = CUDA_R_32F;

    static constexpr Index           bytes = Index(sizeof(float));

    static constexpr const char*     name  = "FP32";

};


template<> struct TypeInfo<Type::BF16>

{

    using type = __nv_bfloat16;

    static constexpr cudnnDataType_t cudnn = CUDNN_DATA_BFLOAT16;

    static constexpr cudaDataType_t  cuda  = CUDA_R_16BF;

    static constexpr Index           bytes = Index(sizeof(__nv_bfloat16));

    static constexpr const char*     name  = "BF16";

};


template<> struct TypeInfo<Type::INT8>

{

    using type = int8_t;

    static constexpr cudnnDataType_t cudnn = CUDNN_DATA_INT8;

    static constexpr cudaDataType_t  cuda  = CUDA_R_8I;

    static constexpr Index           bytes = Index(1);

    static constexpr const char*     name  = "INT8";

};


template<Type... Supported, typename F>


void visit_type(Type t, F&& f)

{

    bool matched = false;

    ((t == Supported && (f(TypeInfo<Supported>{}), matched = true, false)) || ...);

    if (!matched) throw runtime_error("visit_type: unsupported Type value");

}


template<Type... Supported, typename F>


void visit_type_pair(Type t_in, Type t_out, F&& f)

{

    visit_type<Supported...>(t_in, [&](auto in_info)

    {

        visit_type<Supported...>(t_out, [&](auto out_info)

        {

            f(in_info, out_info);

        });

    });

}


inline cudnnDataType_t to_cudnn(Type type) noexcept

{

    switch (type)

    {

        case Type::FP32: return TypeInfo<Type::FP32>::cudnn;

        case Type::BF16: return TypeInfo<Type::BF16>::cudnn;

        case Type::INT8: return TypeInfo<Type::INT8>::cudnn;

        default:         return TypeInfo<Type::FP32>::cudnn;

    }

}


inline cudaDataType_t to_cuda(Type type) noexcept

{

    switch (type)

    {

        case Type::FP32: return TypeInfo<Type::FP32>::cuda;

        case Type::BF16: return TypeInfo<Type::BF16>::cuda;

        case Type::INT8: return TypeInfo<Type::INT8>::cuda;

        default:         return TypeInfo<Type::FP32>::cuda;

    }

}


inline Index type_bytes(Type type) noexcept

{

    switch (type)

    {

        case Type::FP32: return TypeInfo<Type::FP32>::bytes;

        case Type::BF16: return TypeInfo<Type::BF16>::bytes;

        case Type::INT8: return TypeInfo<Type::INT8>::bytes;

        default:         return TypeInfo<Type::FP32>::bytes;

    }

}


class Configuration

{

public:


    struct Resolved

    {

        Device device          = Device::CPU;

        Type   training_type  = Type::FP32;

        Type   inference_type = Type::FP32;

    };


    static Configuration& instance()

    {

        static Configuration configuration;

        return configuration;

    }


    void set(Device new_device          = Device::Auto,

             Type   new_training_type   = Type::Auto,

             Type   new_inference_type  = Type::Auto);


    Device get_device()         const { return device; }

    Type   get_training_type()  const { return training_type; }

    Type   get_inference_type() const { return inference_type; }


    const Resolved& resolve() const

    {

        if (cache_valid)

            return cached_resolved;


        return resolve_slow();

    }


    bool is_gpu() const { return resolve().device == Device::CUDA; }

    bool is_cpu() const { return resolve().device == Device::CPU; }


    bool is_bf16_training()  const { return resolve().training_type  == Type::BF16; }

    bool is_bf16_inference() const { return resolve().inference_type == Type::BF16; }


private:


    Configuration() = default;


    const Resolved& resolve_slow() const;


    Device device         = Device::Auto;

    Type   training_type  = Type::Auto;

    Type   inference_type = Type::Auto;


    mutable Resolved             cached_resolved;

    mutable std::atomic<bool>    cache_valid{false};

};


}


// OpenNN: Open Neural Networks Library.

// Copyright(C) 2005-2026 Artificial Intelligence Techniques, SL.

// Licensed under the GNU Lesser General Public License v2.1 or later.

opennn::Configuration
Definition configuration.h:103

opennn::Configuration::resolve
const Resolved & resolve() const
Definition configuration.h:127

opennn::Configuration::is_cpu
bool is_cpu() const
Definition configuration.h:136

opennn::Configuration::get_device
Device get_device() const
Definition configuration.h:123

opennn::Configuration::get_training_type
Type get_training_type() const
Definition configuration.h:124

opennn::Configuration::is_bf16_inference
bool is_bf16_inference() const
Definition configuration.h:139

opennn::Configuration::is_bf16_training
bool is_bf16_training() const
Definition configuration.h:138

opennn::Configuration::is_gpu
bool is_gpu() const
Definition configuration.h:135

opennn::Configuration::get_inference_type
Type get_inference_type() const
Definition configuration.h:125

opennn::Configuration::instance
static Configuration & instance()
Definition configuration.h:113

opennn::Configuration::set
void set(Device new_device=Device::Auto, Type new_training_type=Type::Auto, Type new_inference_type=Type::Auto)

opennn
Definition adaptive_moment_estimation.h:19

opennn::cudnnDataType_t
cudnnDataType_t
Definition neural_network.h:88

opennn::CUDNN_DATA_INT8
@ CUDNN_DATA_INT8
Definition neural_network.h:88

opennn::CUDNN_DATA_FLOAT
@ CUDNN_DATA_FLOAT
Definition neural_network.h:88

opennn::CUDNN_DATA_BFLOAT16
@ CUDNN_DATA_BFLOAT16
Definition neural_network.h:88

opennn::type_bytes
Index type_bytes(Type type) noexcept
Definition configuration.h:91

opennn::Device
Device
Definition configuration.h:16

opennn::Device::Auto
@ Auto
Definition configuration.h:16

opennn::Device::CPU
@ CPU
Definition configuration.h:16

opennn::Device::CUDA
@ CUDA
Definition configuration.h:16

opennn::to_cudnn
cudnnDataType_t to_cudnn(Type type) noexcept
Definition configuration.h:69

opennn::Type
Type
Definition configuration.h:18

opennn::Type::Auto
@ Auto
Definition configuration.h:18

opennn::Type::FP32
@ FP32
Definition configuration.h:18

opennn::Type::INT8
@ INT8
Definition configuration.h:18

opennn::Type::BF16
@ BF16
Definition configuration.h:18

opennn::cudaDataType_t
cudaDataType_t
Definition neural_network.h:82

opennn::CUDA_R_8I
@ CUDA_R_8I
Definition neural_network.h:82

opennn::CUDA_R_16BF
@ CUDA_R_16BF
Definition neural_network.h:82

opennn::CUDA_R_32F
@ CUDA_R_32F
Definition neural_network.h:82

opennn::visit_type
void visit_type(Type t, F &&f)
Definition configuration.h:50

opennn::to_cuda
cudaDataType_t to_cuda(Type type) noexcept
Definition configuration.h:80

opennn::visit_type_pair
void visit_type_pair(Type t_in, Type t_out, F &&f)
Definition configuration.h:58

pch.h

opennn::Configuration::Resolved
Definition configuration.h:107

opennn::Configuration::Resolved::training_type
Type training_type
Definition configuration.h:109

opennn::Configuration::Resolved::inference_type
Type inference_type
Definition configuration.h:110

opennn::Configuration::Resolved::device
Device device
Definition configuration.h:108

opennn::TypeInfo< Type::BF16 >::type
__nv_bfloat16 type
Definition configuration.h:33

opennn::TypeInfo< Type::BF16 >::bytes
static constexpr Index bytes
Definition configuration.h:36

opennn::TypeInfo< Type::BF16 >::cuda
static constexpr cudaDataType_t cuda
Definition configuration.h:35

opennn::TypeInfo< Type::BF16 >::cudnn
static constexpr cudnnDataType_t cudnn
Definition configuration.h:34

opennn::TypeInfo< Type::BF16 >::name
static constexpr const char * name
Definition configuration.h:37

opennn::TypeInfo< Type::FP32 >::type
float type
Definition configuration.h:24

opennn::TypeInfo< Type::FP32 >::bytes
static constexpr Index bytes
Definition configuration.h:27

opennn::TypeInfo< Type::FP32 >::cudnn
static constexpr cudnnDataType_t cudnn
Definition configuration.h:25

opennn::TypeInfo< Type::FP32 >::name
static constexpr const char * name
Definition configuration.h:28

opennn::TypeInfo< Type::FP32 >::cuda
static constexpr cudaDataType_t cuda
Definition configuration.h:26

opennn::TypeInfo< Type::INT8 >::cuda
static constexpr cudaDataType_t cuda
Definition configuration.h:44

opennn::TypeInfo< Type::INT8 >::type
int8_t type
Definition configuration.h:42

opennn::TypeInfo< Type::INT8 >::cudnn
static constexpr cudnnDataType_t cudnn
Definition configuration.h:43

opennn::TypeInfo< Type::INT8 >::name
static constexpr const char * name
Definition configuration.h:46

opennn::TypeInfo< Type::INT8 >::bytes
static constexpr Index bytes
Definition configuration.h:45

opennn::TypeInfo
Definition configuration.h:20

opennn::__nv_bfloat16
Definition neural_network.h:78

opennn::opennn::Configuration::Resolved::device
Device device
Definition neural_network.h:108

opennn::opennn::Configuration::Resolved::training_type
Type training_type
Definition neural_network.h:109

opennn::opennn::Configuration::Resolved::inference_type
Type inference_type
Definition neural_network.h:110