d4/dfa/a00746_source.html

 //////////////////////////////////////////////////////////////////////////////////////
 // This file is distributed under the University of Illinois/NCSA Open Source License.
 // See LICENSE file in top directory for details.
 //
 // Copyright (c) 2021 QMCPACK developers.
 //
 // File developed by: Ye Luo, yeluo@anl.gov, Argonne National Laboratory
 //                    Peter Doak, doakpw@ornl.gov, Oak Ridge National Laboratory
 //
 // File created by: Ye Luo, yeluo@anl.gov, Argonne National Laboratory
 //////////////////////////////////////////////////////////////////////////////////////

 #ifndef QMCPLUSPLUS_CUBLAS_H
 #define QMCPLUSPLUS_CUBLAS_H

 #include <complex>
 #include <iostream>
 #include <string>
 #include <stdexcept>
 #include "config.h"
 #ifndef QMC_CUDA2HIP
 #include <cublas_v2.h>
 #define castNativeType castCUDAType
 #else
 #include <hipblas/hipblas.h>
 #include "Platforms/ROCm/cuda2hip.h"
 #include "Platforms/ROCm/hipBLAS.hpp"
 #include "Platforms/ROCm/hipblasTypeMapping.hpp"
 #define castNativeType casthipblasType
 #endif
 #include "CUDATypeMapping.hpp"
 #include "type_traits/type_manipulation.hpp"

 #define cublasErrorCheck(ans, cause)                \
   {                                                 \
     cublasAssert((ans), cause, __FILE__, __LINE__); \
   }

 /// prints cuBLAS error messages. Always use cublasErrorCheck macro.
 inline void cublasAssert(cublasStatus_t code, const std::string& cause, const char* file, int line, bool abort = true)
 {
   if (code != CUBLAS_STATUS_SUCCESS)
   {
     std::string cublas_error;
     switch (code)
     {
     case CUBLAS_STATUS_NOT_INITIALIZED:
       cublas_error = "CUBLAS_STATUS_NOT_INITIALIZED";
       break;
     case CUBLAS_STATUS_ALLOC_FAILED:
       cublas_error = "CUBLAS_STATUS_ALLOC_FAILED";
       break;
     case CUBLAS_STATUS_INVALID_VALUE:
       cublas_error = "CUBLAS_STATUS_INVALID_VALUE";
       break;
     case CUBLAS_STATUS_ARCH_MISMATCH:
       cublas_error = "CUBLAS_STATUS_ARCH_MISMATCH";
       break;
     case CUBLAS_STATUS_MAPPING_ERROR:
       cublas_error = "CUBLAS_STATUS_MAPPING_ERROR";
       break;
     case CUBLAS_STATUS_EXECUTION_FAILED:
       cublas_error = "CUBLAS_STATUS_EXECUTION_FAILED";
       break;
     case CUBLAS_STATUS_INTERNAL_ERROR:
       cublas_error = "CUBLAS_STATUS_INTERNAL_ERROR";
       break;
     case CUBLAS_STATUS_NOT_SUPPORTED:
       cublas_error = "CUBLAS_STATUS_NOT_SUPPORTED";
       break;
 #ifndef QMC_CUDA2HIP
     case CUBLAS_STATUS_LICENSE_ERROR:
       cublas_error = "CUBLAS_STATUS_LICENSE_ERROR";
       break;
 #endif
     default:
       cublas_error = "<unknown>";
     }

     std::ostringstream err;
     err << "cublasAssert: " << cublas_error << ", file " << file << " , line " << line << std::endl
         << cause << std::endl;
     std::cerr << err.str();
     //if (abort) exit(code);
     throw std::runtime_error(cause);
   }
 }

 namespace qmcplusplus
 {
 /** interface to cuBLAS calls for different data types S/C/D/Z
  */
 namespace cuBLAS
 {

 inline cublasOperation_t convertOperation(const char trans)
 {
   if (trans == 'N' || trans == 'n')
     return CUBLAS_OP_N;
   else if (trans == 'T' || trans == 't')
     return CUBLAS_OP_T;
   else if (trans == 'C' || trans == 'c')
     return CUBLAS_OP_C;
   else
     throw std::runtime_error(
         "cuBLAS::convertOperation trans can only be 'N', 'T', 'C', 'n', 't', 'c'. Input value is " +
         std::string(1, trans));
 }

 inline cublasStatus_t geam(cublasHandle_t& handle,
                            cublasOperation_t& transa,
                            cublasOperation_t& transb,
                            int m,
                            int n,
                            const float* alpha,
                            const float* A,
                            int lda,
                            const float* beta,
                            const float* B,
                            int ldb,
                            float* C,
                            int ldc)
 {
   return cublasSgeam(handle, transa, transb, m, n, alpha, A, lda, beta, B, ldb, C, ldc);
 }

 inline cublasStatus_t geam(cublasHandle_t& handle,
                            cublasOperation_t transa,
                            cublasOperation_t transb,
                            int m,
                            int n,
                            const double* alpha,
                            const double* A,
                            int lda,
                            const double* beta,
                            const double* B,
                            int ldb,
                            double* C,
                            int ldc)
 {
   return cublasDgeam(handle, transa, transb, m, n, alpha, A, lda, beta, B, ldb, C, ldc);
 }

 inline cublasStatus_t geam(cublasHandle_t& handle,
                            cublasOperation_t transa,
                            cublasOperation_t transb,
                            int m,
                            int n,
                            const std::complex<double>* alpha,
                            const std::complex<double>* A,
                            int lda,
                            const std::complex<double>* beta,
                            const std::complex<double>* B,
                            int ldb,
                            std::complex<double>* C,
                            int ldc)
 {
   return cublasZgeam(handle, transa, transb, m, n, castNativeType(alpha), castNativeType(A), lda, castNativeType(beta),
                      castNativeType(B), ldb, castNativeType(C), ldc);
 }

 inline cublasStatus_t geam(cublasHandle_t& handle,
                            cublasOperation_t transa,
                            cublasOperation_t transb,
                            int m,
                            int n,
                            const std::complex<float>* alpha,
                            const std::complex<float>* A,
                            int lda,
                            const std::complex<float>* beta,
                            const std::complex<float>* B,
                            int ldb,
                            std::complex<float>* C,
                            int ldc)
 {
   return cublasCgeam(handle, transa, transb, m, n, castNativeType(alpha), castNativeType(A), lda, castNativeType(beta),
                      castNativeType(B), ldb, castNativeType(C), ldc);
 }

 inline cublasStatus_t getrf_batched(cublasHandle_t& handle,
                                     int n,
                                     float* A[],
                                     int lda,
                                     int* PivotArray,
                                     int* infoArray,
                                     int batchSize)
 {
   return cublasSgetrfBatched(handle, n, A, lda, PivotArray, infoArray, batchSize);
 }

 inline cublasStatus_t getrf_batched(cublasHandle_t& handle,
                                     int n,
                                     double* A[],
                                     int lda,
                                     int* PivotArray,
                                     int* infoArray,
                                     int batchSize)
 {
   return cublasDgetrfBatched(handle, n, A, lda, PivotArray, infoArray, batchSize);
 }

 inline cublasStatus_t getrf_batched(cublasHandle_t& handle,
                                     int n,
                                     std::complex<float>* A[],
                                     int lda,
                                     int* PivotArray,
                                     int* infoArray,
                                     int batchSize)
 {
   return cublasCgetrfBatched(handle, n, castCUDAType(A), lda, PivotArray, infoArray, batchSize);
 }

 inline cublasStatus_t getrf_batched(cublasHandle_t& handle,
                                     int n,
                                     std::complex<double>* A[],
                                     int lda,
                                     int* PivotArray,
                                     int* infoArray,
                                     int batchSize)
 {
   return cublasZgetrfBatched(handle, n, castCUDAType(A), lda, PivotArray, infoArray, batchSize);
 }

 inline cublasStatus_t getri_batched(cublasHandle_t& handle,
                                     int n,
                                     float* A[],
                                     int lda,
                                     int* PivotArray,
                                     float* C[],
                                     int ldc,
                                     int* infoArray,
                                     int batchSize)
 {
   return cublasSgetriBatched(handle, n, A, lda, PivotArray, C, ldc, infoArray, batchSize);
 }

 inline cublasStatus_t getri_batched(cublasHandle_t& handle,
                                     int n,
                                     double* A[],
                                     int lda,
                                     int* PivotArray,
                                     double* C[],
                                     int ldc,
                                     int* infoArray,
                                     int batchSize)
 {
   return cublasDgetriBatched(handle, n, A, lda, PivotArray, C, ldc, infoArray, batchSize);
 }

 inline cublasStatus_t getri_batched(cublasHandle_t& handle,
                                     int n,
                                     std::complex<float>* A[],
                                     int lda,
                                     int* PivotArray,
                                     std::complex<float>* C[],
                                     int ldc,
                                     int* infoArray,
                                     int batchSize)
 {
   return cublasCgetriBatched(handle, n, castCUDAType(A), lda, PivotArray, castCUDAType(C), ldc, infoArray, batchSize);
 }

 inline cublasStatus_t getri_batched(cublasHandle_t& handle,
                                     int n,
                                     std::complex<double>* A[],
                                     int lda,
                                     int* PivotArray,
                                     std::complex<double>* C[],
                                     int ldc,
                                     int* infoArray,
                                     int batchSize)
 {
   return cublasZgetriBatched(handle, n, castCUDAType(A), lda, PivotArray, castCUDAType(C), ldc, infoArray, batchSize);
 }

 }; // namespace cuBLAS

 } // namespace qmcplusplus
 #undef castNativeType
 #endif // QMCPLUSPLUS_CUBLAS_H
cublasCgeam
#define cublasCgeam
Definition: cuda2hip.h:42

CUBLAS_OP_N
#define CUBLAS_OP_N
Definition: cuda2hip.h:19

cublasCgetriBatched
#define cublasCgetriBatched
Definition: cuda2hip.h:48

hipBLAS.hpp

qmcplusplus
helper functions for EinsplineSetBuilder
Definition: Configuration.h:43

CUBLAS_STATUS_INVALID_VALUE
#define CUBLAS_STATUS_INVALID_VALUE
Definition: cuda2hip.h:26

qmcplusplus::cuBLAS::getrf_batched
cublasStatus_t getrf_batched(cublasHandle_t &handle, int n, float *A[], int lda, int *PivotArray, int *infoArray, int batchSize)
Definition: cuBLAS.hpp:180

CUBLAS_STATUS_ALLOC_FAILED
#define CUBLAS_STATUS_ALLOC_FAILED
Definition: cuda2hip.h:22

cublasDgetriBatched
#define cublasDgetriBatched
Definition: cuda2hip.h:55

cublasSgetrfBatched
#define cublasSgetrfBatched
Definition: cuda2hip.h:61

type_manipulation.hpp

CUBLAS_STATUS_SUCCESS
#define CUBLAS_STATUS_SUCCESS
Definition: cuda2hip.h:31

cublasCgetrfBatched
#define cublasCgetrfBatched
Definition: cuda2hip.h:47

castNativeType
#define castNativeType
Definition: cuBLAS.hpp:23

CUBLAS_STATUS_EXECUTION_FAILED
#define CUBLAS_STATUS_EXECUTION_FAILED
Definition: cuda2hip.h:24

CUBLAS_STATUS_MAPPING_ERROR
#define CUBLAS_STATUS_MAPPING_ERROR
Definition: cuda2hip.h:28

cublasZgeam
#define cublasZgeam
Definition: cuda2hip.h:63

CUDATypeMapping.hpp

hipblasTypeMapping.hpp

cublasOperation_t
#define cublasOperation_t
Definition: cuda2hip.h:41

cublasStatus_t
#define cublasStatus_t
Definition: cuda2hip.h:36

CUBLAS_STATUS_NOT_SUPPORTED
#define CUBLAS_STATUS_NOT_SUPPORTED
Definition: cuda2hip.h:30

cublasAssert
void cublasAssert(cublasStatus_t code, const std::string &cause, const char *file, int line, bool abort=true)
prints cuBLAS error messages. Always use cublasErrorCheck macro.
Definition: cuBLAS.hpp:40

qmcplusplus::Units::charge::C
const real C
Definition: unit_conversion.h:77

cuda2hip.h

qmcplusplus::Units::distance::m
const real m
Definition: unit_conversion.h:37

CUBLAS_OP_C
#define CUBLAS_OP_C
Definition: cuda2hip.h:21

CUBLAS_STATUS_NOT_INITIALIZED
#define CUBLAS_STATUS_NOT_INITIALIZED
Definition: cuda2hip.h:29

cublasSgeam
#define cublasSgeam
Definition: cuda2hip.h:56

CUBLAS_OP_T
#define CUBLAS_OP_T
Definition: cuda2hip.h:20

cublasZgetriBatched
#define cublasZgetriBatched
Definition: cuda2hip.h:69

qmcplusplus::castCUDAType
CUDATypeMap< T > castCUDAType(T var)
Definition: CUDATypeMapping.hpp:53

qmcplusplus::lda
int lda
Definition: test_cuBLAS_LU.cpp:217

cublasZgetrfBatched
#define cublasZgetrfBatched
Definition: cuda2hip.h:68

qmcplusplus::cuBLAS::getri_batched
cublasStatus_t getri_batched(cublasHandle_t &handle, int n, float *A[], int lda, int *PivotArray, float *C[], int ldc, int *infoArray, int batchSize)
Definition: cuBLAS.hpp:224

cublasDgeam
#define cublasDgeam
Definition: cuda2hip.h:49

qmcplusplus::n
int n
Definition: test_cuBLAS_LU.cpp:216

qmcplusplus::cuBLAS::geam
cublasStatus_t geam(cublasHandle_t &handle, cublasOperation_t &transa, cublasOperation_t &transb, int m, int n, const float *alpha, const float *A, int lda, const float *beta, const float *B, int ldb, float *C, int ldc)
Definition: cuBLAS.hpp:110

cublasDgetrfBatched
#define cublasDgetrfBatched
Definition: cuda2hip.h:54

CUBLAS_STATUS_INTERNAL_ERROR
#define CUBLAS_STATUS_INTERNAL_ERROR
Definition: cuda2hip.h:25

qmcplusplus::cuBLAS::convertOperation
cublasOperation_t convertOperation(const char trans)
Definition: cuBLAS.hpp:96

B
double B(double x, int k, int i, const std::vector< double > &t)
Definition: soecp_eval_reference.cpp:27

qmcplusplus::Units::distance::A
const real A
Definition: unit_conversion.h:38

CUBLAS_STATUS_ARCH_MISMATCH
#define CUBLAS_STATUS_ARCH_MISMATCH
Definition: cuda2hip.h:23

cublasSgetriBatched
#define cublasSgetriBatched
Definition: cuda2hip.h:62

cublasHandle_t
#define cublasHandle_t
Definition: cuda2hip.h:35