documentation/reference/pch_8h_source.html

#pragma once


// IntelliSense-only: real builds get OPENNN_HAS_CUDA from CMake.

#if defined(__INTELLISENSE__) && !defined(OPENNN_HAS_CUDA)

#define OPENNN_HAS_CUDA

#endif


#ifndef EIGEN_USE_THREADS

#define EIGEN_USE_THREADS

#endif


#define EIGEN_MAX_ALIGN_BYTES 64

#define EIGEN_NO_DEBUG

#define NOMINMAX

#define _SILENCE_CXX17_ITERATOR_BASE_CLASS_DEPRECATION_WARNING

#define _CRT_SECURE_NO_WARNINGS

#define EIGEN_PERMANENTLY_DISABLE_STUPID_WARNINGS

#define _SILENCE_EXPERIMENTAL_FILESYSTEM_DEPRECATION_WARNING


#include <algorithm>

#include <string>

#include <cassert>

#include <cmath>

#include <ctime>

#include <filesystem>

#include <functional>

#include <iomanip>

#include <iostream>

#include <time.h>

#include <iterator>

#include <map>

#include <numeric>

#include <vector>

#include <unordered_map>

#include <unordered_set>

#include <exception>

#include <memory>

#include <random>

#include <regex>

#include <cstring>

#include <cstdlib>

#include <fstream>

#include <stdexcept>

#include <stdlib.h>

#include <set>

#include <sstream>

#include <omp.h>


#include <Eigen/Core>

#include <unsupported/Eigen/CXX11/Tensor>

#include <Eigen/src/Core/util/DisableStupidWarnings.h>


#ifdef OPENNN_HAS_CUDA


#include <cuda.h>

#include <cuda_runtime.h>

#include <cublas_v2.h>

#include <cublasXt.h>

#include <cublasLt.h>

#include <curand.h>

#include <cudnn.h>

#include <cuda_bf16.h>

#include <nvtx3/nvToolsExt.h>


#else


// CPU-only stubs.


// --- Runtime / library handles ---

using cudaStream_t     = void*;

using cudaEvent_t      = void*;

using cublasHandle_t   = void*;

using cublasLtHandle_t = void*;

using cudnnHandle_t    = void*;


// --- Scalar / opaque types ---

struct __nv_bfloat16 {};

struct __half {};


// --- CUDA / cuBLAS enums ---

enum cudaDataType_t                  { CUDA_R_32F = 0, CUDA_R_16F = 2, CUDA_R_8I = 3, CUDA_R_32I = 10, CUDA_R_16BF = 14 };

enum cublasComputeType_t             { CUBLAS_COMPUTE_32F = 0, CUBLAS_COMPUTE_32F_FAST_16BF = 65, CUBLAS_COMPUTE_32F_FAST_TF32 = 68 };

enum cublasOperation_t               { CUBLAS_OP_N = 0, CUBLAS_OP_T = 1 };

enum cublasLtEpilogue_t              { CUBLASLT_EPILOGUE_DEFAULT = 1, CUBLASLT_EPILOGUE_BIAS = 4, CUBLASLT_EPILOGUE_RELU_BIAS = 132 };


// --- cuDNN enums ---

enum cudnnDataType_t                 { CUDNN_DATA_FLOAT = 0, CUDNN_DATA_HALF = 2, CUDNN_DATA_INT8 = 3, CUDNN_DATA_INT32 = 4, CUDNN_DATA_BFLOAT16 = 14 };

enum cudnnActivationMode_t           { CUDNN_ACTIVATION_IDENTITY = 0, CUDNN_ACTIVATION_SIGMOID = 1, CUDNN_ACTIVATION_RELU = 2, CUDNN_ACTIVATION_TANH = 3, CUDNN_ACTIVATION_ELU = 4 };

enum cudnnPoolingMode_t              { CUDNN_POOLING_MAX = 0 };

enum cudnnBatchNormMode_t            { CUDNN_BATCHNORM_PER_ACTIVATION = 0 };

enum cudnnConvolutionFwdAlgo_t       { CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_GEMM = 0 };

enum cudnnConvolutionBwdDataAlgo_t   { CUDNN_CONVOLUTION_BWD_DATA_ALGO_0 = 0 };

enum cudnnConvolutionBwdFilterAlgo_t { CUDNN_CONVOLUTION_BWD_FILTER_ALGO_0 = 0 };


// --- cuDNN descriptor handles (opaque pointer-typed) ---

struct cudnnTensorStruct {};

using cudnnTensorDescriptor_t      = cudnnTensorStruct*;

using cudnnFilterDescriptor_t      = void*;

using cudnnConvolutionDescriptor_t = void*;

using cudnnPoolingDescriptor_t     = void*;

using cudnnActivationDescriptor_t  = void*;

using cudnnDropoutDescriptor_t     = void*;

using cudnnOpTensorDescriptor_t    = void*;


#endif


#ifdef OPENNN_HAS_CUDA


#include "../opennn/kernel.cuh"


template <typename T>

void check_cuda_status(T status, const char* file, int line, const char* msg)

{

    if (status != 0)

        throw std::runtime_error(std::string(msg) + " Error: " + std::to_string(static_cast<int>(status)) +

                                 " in " + file + ":" + std::to_string(line));

}


#define CHECK_CUDA(x) check_cuda_status(x, __FILE__, __LINE__, "CUDA")

#define CHECK_CUBLAS(x) check_cuda_status(x, __FILE__, __LINE__, "CuBLAS")

#define CHECK_CUDNN(x) check_cuda_status(x, __FILE__, __LINE__, "cuDNN")


#endif


using namespace std;

using namespace Eigen;


namespace opennn {

constexpr float EPSILON = numeric_limits<float>::epsilon();

constexpr float MAX = numeric_limits<float>::max();

constexpr float NEG_INFINITY = -numeric_limits<float>::infinity();

constexpr float QUIET_NAN = numeric_limits<float>::quiet_NaN();

constexpr float SOFTMAX_MASK_VALUE = float(-1e9f);


template <typename T>


ostream& operator<<(ostream& os, const vector<T>& vec)

{

    os << "[ ";

    for (size_t i = 0; i < vec.size(); ++i)

    {

        os << vec[i];

        if (i + 1 < vec.size()) os << "; ";

    }

    os << " ]";

    return os;

}


}


constexpr int Layout = Eigen::RowMajor;


using MatrixR = Matrix<float, Dynamic, Dynamic, Layout>;

using MatrixI = Matrix<Index, Dynamic, Dynamic, Layout>;

using MatrixB = Matrix<bool, Dynamic, Dynamic, Layout>;


using VectorR = Matrix<float, Dynamic, 1>;

using VectorI = Matrix<Index, Dynamic, 1>;

using VectorB = Matrix<bool, Dynamic, 1>;


using VectorMap = Map<VectorR, AlignedMax>;

using MatrixMap = Map<MatrixR, Layout | AlignedMax>;


using Tensor0 = Tensor<float, 0, Layout | AlignedMax>;

using Tensor2 = Tensor<float, 2, Layout | AlignedMax>;

using Tensor3 = Tensor<float, 3, Layout | AlignedMax>;

using Tensor4 = Tensor<float, 4, Layout | AlignedMax>;


template <int Rank>

using TensorR = Tensor<float, Rank, Layout | AlignedMax>;


using TensorMap2 = TensorMap<Tensor<float, 2, Layout | AlignedMax>, AlignedMax>;

using TensorMap3 = TensorMap<Tensor<float, 3, Layout | AlignedMax>, AlignedMax>;

using TensorMap4 = TensorMap<Tensor<float, 4, Layout | AlignedMax>, AlignedMax>;


template <int Rank>

using TensorMapR = TensorMap<Tensor<float, Rank, Layout | AlignedMax>, AlignedMax>;


#pragma GCC diagnostic push

#pragma GCC diagnostic ignored "-Wunused-parameter"

#include "json.h"

#pragma GCC diagnostic pop


// OpenNN: Open Neural Networks Library.

// Copyright(C) 2005-2026 Artificial Intelligence Techniques, SL.

// Licensed under the GNU Lesser General Public License v2.1 or later.

json.h

opennn
Definition adaptive_moment_estimation.h:19

opennn::MAX
constexpr float MAX
Definition pch.h:130

opennn::NEG_INFINITY
constexpr float NEG_INFINITY
Definition pch.h:131

opennn::EPSILON
constexpr float EPSILON
Definition pch.h:129

opennn::SOFTMAX_MASK_VALUE
constexpr float SOFTMAX_MASK_VALUE
Definition pch.h:133

opennn::QUIET_NAN
constexpr float QUIET_NAN
Definition pch.h:132

opennn::operator<<
ostream & operator<<(ostream &os, const vector< T > &vec)
Definition pch.h:136

cudnnTensorDescriptor_t
cudnnTensorStruct * cudnnTensorDescriptor_t
Definition pch.h:97

VectorMap
Map< VectorR, AlignedMax > VectorMap
Definition pch.h:159

TensorMapR
TensorMap< Tensor< float, Rank, Layout|AlignedMax >, AlignedMax > TensorMapR
Definition pch.h:175

cudnnHandle_t
void * cudnnHandle_t
Definition pch.h:74

Tensor3
Tensor< float, 3, Layout|AlignedMax > Tensor3
Definition pch.h:164

cudaEvent_t
void * cudaEvent_t
Definition pch.h:71

VectorR
Matrix< float, Dynamic, 1 > VectorR
Definition pch.h:155

cudaStream_t
void * cudaStream_t
Definition pch.h:70

cudnnConvolutionFwdAlgo_t
cudnnConvolutionFwdAlgo_t
Definition pch.h:91

CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_GEMM
@ CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_GEMM
Definition pch.h:91

VectorB
Matrix< bool, Dynamic, 1 > VectorB
Definition pch.h:157

cudnnFilterDescriptor_t
void * cudnnFilterDescriptor_t
Definition pch.h:98

cudaDataType_t
cudaDataType_t
Definition pch.h:81

CUDA_R_32F
@ CUDA_R_32F
Definition pch.h:81

CUDA_R_16F
@ CUDA_R_16F
Definition pch.h:81

CUDA_R_8I
@ CUDA_R_8I
Definition pch.h:81

CUDA_R_32I
@ CUDA_R_32I
Definition pch.h:81

CUDA_R_16BF
@ CUDA_R_16BF
Definition pch.h:81

TensorR
Tensor< float, Rank, Layout|AlignedMax > TensorR
Definition pch.h:168

Tensor2
Tensor< float, 2, Layout|AlignedMax > Tensor2
Definition pch.h:163

TensorMap4
TensorMap< Tensor< float, 4, Layout|AlignedMax >, AlignedMax > TensorMap4
Definition pch.h:172

cublasLtHandle_t
void * cublasLtHandle_t
Definition pch.h:73

cudnnActivationMode_t
cudnnActivationMode_t
Definition pch.h:88

CUDNN_ACTIVATION_RELU
@ CUDNN_ACTIVATION_RELU
Definition pch.h:88

CUDNN_ACTIVATION_SIGMOID
@ CUDNN_ACTIVATION_SIGMOID
Definition pch.h:88

CUDNN_ACTIVATION_TANH
@ CUDNN_ACTIVATION_TANH
Definition pch.h:88

CUDNN_ACTIVATION_IDENTITY
@ CUDNN_ACTIVATION_IDENTITY
Definition pch.h:88

CUDNN_ACTIVATION_ELU
@ CUDNN_ACTIVATION_ELU
Definition pch.h:88

cudnnOpTensorDescriptor_t
void * cudnnOpTensorDescriptor_t
Definition pch.h:103

MatrixI
Matrix< Index, Dynamic, Dynamic, Layout > MatrixI
Definition pch.h:152

cudnnPoolingMode_t
cudnnPoolingMode_t
Definition pch.h:89

CUDNN_POOLING_MAX
@ CUDNN_POOLING_MAX
Definition pch.h:89

Tensor0
Tensor< float, 0, Layout|AlignedMax > Tensor0
Definition pch.h:162

cudnnDropoutDescriptor_t
void * cudnnDropoutDescriptor_t
Definition pch.h:102

cublasLtEpilogue_t
cublasLtEpilogue_t
Definition pch.h:84

CUBLASLT_EPILOGUE_BIAS
@ CUBLASLT_EPILOGUE_BIAS
Definition pch.h:84

CUBLASLT_EPILOGUE_RELU_BIAS
@ CUBLASLT_EPILOGUE_RELU_BIAS
Definition pch.h:84

CUBLASLT_EPILOGUE_DEFAULT
@ CUBLASLT_EPILOGUE_DEFAULT
Definition pch.h:84

cublasHandle_t
void * cublasHandle_t
Definition pch.h:72

cublasOperation_t
cublasOperation_t
Definition pch.h:83

CUBLAS_OP_N
@ CUBLAS_OP_N
Definition pch.h:83

CUBLAS_OP_T
@ CUBLAS_OP_T
Definition pch.h:83

cudnnDataType_t
cudnnDataType_t
Definition pch.h:87

CUDNN_DATA_INT32
@ CUDNN_DATA_INT32
Definition pch.h:87

CUDNN_DATA_BFLOAT16
@ CUDNN_DATA_BFLOAT16
Definition pch.h:87

CUDNN_DATA_HALF
@ CUDNN_DATA_HALF
Definition pch.h:87

CUDNN_DATA_INT8
@ CUDNN_DATA_INT8
Definition pch.h:87

CUDNN_DATA_FLOAT
@ CUDNN_DATA_FLOAT
Definition pch.h:87

MatrixB
Matrix< bool, Dynamic, Dynamic, Layout > MatrixB
Definition pch.h:153

cudnnPoolingDescriptor_t
void * cudnnPoolingDescriptor_t
Definition pch.h:100

cudnnConvolutionBwdDataAlgo_t
cudnnConvolutionBwdDataAlgo_t
Definition pch.h:92

CUDNN_CONVOLUTION_BWD_DATA_ALGO_0
@ CUDNN_CONVOLUTION_BWD_DATA_ALGO_0
Definition pch.h:92

cudnnBatchNormMode_t
cudnnBatchNormMode_t
Definition pch.h:90

CUDNN_BATCHNORM_PER_ACTIVATION
@ CUDNN_BATCHNORM_PER_ACTIVATION
Definition pch.h:90

MatrixR
Matrix< float, Dynamic, Dynamic, Layout > MatrixR
Definition pch.h:151

TensorMap2
TensorMap< Tensor< float, 2, Layout|AlignedMax >, AlignedMax > TensorMap2
Definition pch.h:170

VectorI
Matrix< Index, Dynamic, 1 > VectorI
Definition pch.h:156

MatrixMap
Map< MatrixR, Layout|AlignedMax > MatrixMap
Definition pch.h:160

cudnnActivationDescriptor_t
void * cudnnActivationDescriptor_t
Definition pch.h:101

cudnnConvolutionDescriptor_t
void * cudnnConvolutionDescriptor_t
Definition pch.h:99

Layout
constexpr int Layout
Definition pch.h:149

TensorMap3
TensorMap< Tensor< float, 3, Layout|AlignedMax >, AlignedMax > TensorMap3
Definition pch.h:171

Tensor4
Tensor< float, 4, Layout|AlignedMax > Tensor4
Definition pch.h:165

cudnnConvolutionBwdFilterAlgo_t
cudnnConvolutionBwdFilterAlgo_t
Definition pch.h:93

CUDNN_CONVOLUTION_BWD_FILTER_ALGO_0
@ CUDNN_CONVOLUTION_BWD_FILTER_ALGO_0
Definition pch.h:93

cublasComputeType_t
cublasComputeType_t
Definition pch.h:82

CUBLAS_COMPUTE_32F_FAST_TF32
@ CUBLAS_COMPUTE_32F_FAST_TF32
Definition pch.h:82

CUBLAS_COMPUTE_32F
@ CUBLAS_COMPUTE_32F
Definition pch.h:82

CUBLAS_COMPUTE_32F_FAST_16BF
@ CUBLAS_COMPUTE_32F_FAST_16BF
Definition pch.h:82

__half
Definition pch.h:78

__nv_bfloat16
Definition pch.h:77

cudnnTensorStruct
Definition pch.h:96