d9/daf/a00830_source.html

 //////////////////////////////////////////////////////////////////////////////////////
 // This file is distributed under the University of Illinois/NCSA Open Source License.
 // See LICENSE file in top directory for details.
 //
 // Copyright (c) 2024 QMCPACK developers.
 //
 // File developed by: Ye Luo, yeluo@anl.gov, Argonne National Laboratory
 //////////////////////////////////////////////////////////////////////////////////////

 #ifndef QMCPLUSPLUS_ACCELBLAS_OMPTARGET_H
 #define QMCPLUSPLUS_ACCELBLAS_OMPTARGET_H

 #include "AccelBLASHandle.hpp"
 #include "QueueOMPTarget.hpp"
 #include "ompBLAS.hpp"

 namespace qmcplusplus
 {
 namespace compute
 {
 template<>
 class BLASHandle<PlatformKind::OMPTARGET>
 {
 public:
   ompBLAS::ompBLAS_handle h_ompblas;

   BLASHandle(Queue<PlatformKind::OMPTARGET>& queue) : h_ompblas(0) {}
 };

 namespace BLAS
 {

 template<typename T>
 inline void gemm(BLASHandle<PlatformKind::OMPTARGET>& handle,
                  const char transa,
                  const char transb,
                  int m,
                  int n,
                  int k,
                  const T& alpha,
                  const T* A,
                  int lda,
                  const T* B,
                  int ldb,
                  const T& beta,
                  T* C,
                  int ldc)
 {
   if (ompBLAS::gemm(handle.h_ompblas, transa, transb, m, n, k, alpha, A, lda, B, ldb, beta, C, ldc) != 0)
     throw std::runtime_error("ompBLAS::gemm failed!");
 }

 template<typename T>
 inline void gemm_batched(BLASHandle<PlatformKind::OMPTARGET>& handle,
                          const char transa,
                          const char transb,
                          int m,
                          int n,
                          int k,
                          const T& alpha,
                          const T* const A[],
                          int lda,
                          const T* const B[],
                          int ldb,
                          const T& beta,
                          T* const C[],
                          int ldc,
                          int batchCount)
 {
   if (ompBLAS::gemm_batched(handle.h_ompblas, transa, transb, m, n, k, alpha, A, lda, B, ldb, beta, C, ldc,
                             batchCount) != 0)
     throw std::runtime_error("ompBLAS::gemm_batched failed!");
 }


 template<typename T>
 inline void gemv(BLASHandle<PlatformKind::OMPTARGET>& handle,
                          const char trans,
                          const int m,
                          const int n,
                          const T& alpha,
                          const T* const A,
                          const int lda,
                          const T* const x,
                          const int incx,
                          const T& beta,
                          T* const y,
                          const int incy)
 {
   if (ompBLAS::gemv(handle.h_ompblas, trans, m, n, alpha, A, lda, x, incx, beta, y, incy) != 0)
     throw std::runtime_error("ompBLAS::gemv_batched failed!");
 }

 template<typename T>
 inline void gemv_batched(BLASHandle<PlatformKind::OMPTARGET>& handle,
                          const char trans,
                          const int m,
                          const int n,
                          const T* alpha,
                          const T* const A[],
                          const int lda,
                          const T* const x[],
                          const int incx,
                          const T* beta,
                          T* const y[],
                          const int incy,
                          const int batch_count)
 {
   if (ompBLAS::gemv_batched(handle.h_ompblas, trans, m, n, alpha, A, lda, x, incx, beta, y, incy, batch_count) != 0)
     throw std::runtime_error("ompBLAS::gemv_batched failed!");
 }

 template<typename T>
 inline void ger(BLASHandle<PlatformKind::OMPTARGET>& handle,
                         const int m,
                         const int n,
                         const T& alpha,
                         const T* const x,
                         const int incx,
                         const T* const y,
                         const int incy,
                         T* const A,
                         const int lda)
 {
   if (ompBLAS::ger(handle.h_ompblas, m, n, alpha, x, incx, y, incy, A, lda) != 0)
     throw std::runtime_error("ompBLAS::ger_batched failed!");
 }

 template<typename T>
 inline void ger_batched(BLASHandle<PlatformKind::OMPTARGET>& handle,
                         const int m,
                         const int n,
                         const T* alpha,
                         const T* const x[],
                         const int incx,
                         const T* const y[],
                         const int incy,
                         T* const A[],
                         const int lda,
                         const int batch_count)
 {
   if (ompBLAS::ger_batched(handle.h_ompblas, m, n, alpha, x, incx, y, incy, A, lda, batch_count) != 0)
     throw std::runtime_error("ompBLAS::ger_batched failed!");
 }

 template<typename T>
 inline void copy_batched(BLASHandle<PlatformKind::OMPTARGET>& handle,
                          const int n,
                          const T* const x[],
                          const int incx,
                          T* const y[],
                          const int incy,
                          const int batch_count)
 {
   if (ompBLAS::copy_batched(handle.h_ompblas, n, x, incx, y, incy, batch_count) != 0)
     throw std::runtime_error("ompBLAS::copy_batched failed!");
 }

 } // namespace BLAS
 } // namespace compute
 } // namespace qmcplusplus
 #undef castNativeType
 #endif
qmcplusplus::compute::BLAS::gemm
void gemm(BLASHandle< PlatformKind::CUDA > &handle, const char transa, const char transb, int m, int n, int k, const float &alpha, const float *A, int lda, const float *B, int ldb, const float &beta, float *C, int ldc)
Definition: AccelBLAS_CUDA.hpp:49

qmcplusplus::ompBLAS::gemm
ompBLAS_status gemm(ompBLAS_handle &handle, const char transa, const char transb, const int M, const int N, const int K, const T &alpha, const T *const A, const int lda, const T *const B, const int ldb, const T &beta, T *const C, const int ldc)

qmcplusplus::ompBLAS::gemv
ompBLAS_status gemv(ompBLAS_handle &handle, const char trans, const int m, const int n, const T alpha, const T *const A, const int lda, const T *const x, const int incx, const T beta, T *const y, const int incy)

qmcplusplus
helper functions for EinsplineSetBuilder
Definition: Configuration.h:43

qmcplusplus::compute::BLASHandle< PlatformKind::OMPTARGET >
Definition: AccelBLAS_OMPTarget.hpp:22

BLAS
Interfaces to blas library.
Definition: BLAS.hpp:38

qmcplusplus::ompBLAS::ompBLAS_handle
int ompBLAS_handle
Definition: ompBLAS.hpp:30

qmcplusplus::compute::Queue< PlatformKind::OMPTARGET >
Definition: QueueOMPTarget.hpp:24

qmcplusplus::Units::charge::C
const real C
Definition: unit_conversion.h:77

qmcplusplus::Units::distance::m
const real m
Definition: unit_conversion.h:37

QueueOMPTarget.hpp

qmcplusplus::compute::BLASHandle< PlatformKind::OMPTARGET >::BLASHandle
BLASHandle(Queue< PlatformKind::OMPTARGET > &queue)
Definition: AccelBLAS_OMPTarget.hpp:27

qmcplusplus::ompBLAS::gemv_batched
ompBLAS_status gemv_batched(ompBLAS_handle &handle, const char trans, const int m, const int n, const T *alpha, const T *const A[], const int lda, const T *const x[], const int incx, const T *beta, T *const y[], const int incy, const int batch_count)

qmcplusplus::compute::BLAS::ger
void ger(BLASHandle< PlatformKind::CUDA > &handle, const int m, const int n, const float &alpha, const float *const x, const int incx, const float *const y, const int incy, float *const A, const int lda)
Definition: AccelBLAS_CUDA.hpp:225

qmcplusplus::compute::BLAS::gemv_batched
void gemv_batched(BLASHandle< PlatformKind::CUDA > &handle, const char trans, const int m, const int n, const T *alpha, const T *const A[], const int lda, const T *const x[], const int incx, const T *beta, T *const y[], const int incy, const int batch_count)
Definition: AccelBLAS_CUDA.hpp:206

qmcplusplus::compute::BLASHandle< PlatformKind::OMPTARGET >::h_ompblas
ompBLAS::ompBLAS_handle h_ompblas
Definition: AccelBLAS_OMPTarget.hpp:25

AccelBLASHandle.hpp

qmcplusplus::ompBLAS::gemm_batched
ompBLAS_status gemm_batched(ompBLAS_handle &handle, const char transa, const char transb, const int M, const int N, const int K, const T &alpha, const T *const A[], const int lda, const T *const B[], const int ldb, const T &beta, T *const C[], const int ldc, const int batch_count)

qmcplusplus::compute::BLAS::gemm_batched
void gemm_batched(BLASHandle< PlatformKind::CUDA > &handle, const char transa, const char transb, int m, int n, int k, const float &alpha, const float *const A[], int lda, const float *const B[], int ldb, const float &beta, float *const C[], int ldc, int batchCount)
Definition: AccelBLAS_CUDA.hpp:315

qmcplusplus::ompBLAS::ger_batched
ompBLAS_status ger_batched(ompBLAS_handle &handle, const int m, const int n, const T *alpha, const T *const x[], const int incx, const T *const y[], const int incy, T *const A[], const int lda, const int batch_count)

qmcplusplus::lda
int lda
Definition: test_cuBLAS_LU.cpp:217

qmcplusplus::compute::BLAS::copy_batched
void copy_batched(BLASHandle< PlatformKind::CUDA > &handle, const int n, const T *const in[], const int incx, T *const out[], const int incy, const int batch_count)
Definition: AccelBLAS_CUDA.hpp:303

qmcplusplus::n
int n
Definition: test_cuBLAS_LU.cpp:216

qmcplusplus::ompBLAS::ger
ompBLAS_status ger(ompBLAS_handle &handle, const int m, const int n, const T alpha, const T *const x, const int incx, const T *const y, const int incy, T *const A, const int lda)

ompBLAS.hpp

qmcplusplus::compute::BLAS::ger_batched
void ger_batched(BLASHandle< PlatformKind::CUDA > &handle, const int m, const int n, const T *alpha, const T *const x[], const int incx, const T *const y[], const int incy, T *const A[], const int lda, const int batch_count)
Definition: AccelBLAS_CUDA.hpp:286

B
double B(double x, int k, int i, const std::vector< double > &t)
Definition: soecp_eval_reference.cpp:27

qmcplusplus::PlatformKind::OMPTARGET

qmcplusplus::compute::BLAS::gemv
void gemv(BLASHandle< PlatformKind::CUDA > &handle, const char trans, const int m, const int n, const float &alpha, const float *const A, const int lda, const float *const x, const int incx, const float &beta, float *const y, const int incy)
Definition: AccelBLAS_CUDA.hpp:131

qmcplusplus::ompBLAS::copy_batched
ompBLAS_status copy_batched(ompBLAS_handle &handle, const int n, const T *const x[], const int incx, T *const y[], const int incy, const int batch_count)
copy device data from x to y

qmcplusplus::PlatformKind
PlatformKind
Definition: PlatformKinds.hpp:19

qmcplusplus::Units::distance::A
const real A
Definition: unit_conversion.h:38

qmcplusplus::compute::BLASHandle
Definition: AccelBLASHandle.hpp:24