简述cuBLAS相关函数原型(附属工具): 矩阵乘法函数 `cublasSgemm` 和 `cublasDgemm` + 复数矩阵乘法函数 `cublasCgemm` 和 `cublasZgemm`

kingking44

于 2024-07-29 10:38:54 发布

阅读量735

点赞数 26

分类专栏： AI机器智能 cuda GPU 文章标签：矩阵算法线性代数

本文链接：https://blog.csdn.net/kingking44/article/details/140764988

版权

矩阵乘法函数 `cublasSgemm` 和 `cublasDgemm`

两个 cuBLAS 库中的矩阵乘法函数 cublasSgemm 和 cublasDgemm，并将它们重定向到新的 v2 版本 cublasSgemm_v2 和 cublasDgemm_v2。cuBLAS 是 NVIDIA 的基础线性代数库，提供了多种高性能的矩阵运算函数。cublasSgemm 和 cublasDgemm 分别用于执行单精度和双精度的矩阵乘法运算。

详细解释

预处理器宏定义

#define cublasSgemm cublasSgemm_v2
#define cublasDgemm cublasDgemm_v2

这两行代码将 cublasSgemm 和 cublasDgemm 重定向到它们的 v2 版本 cublasSgemm_v2 和 cublasDgemm_v2。这样，当程序中调用 cublasSgemm 或 cublasDgemm 时，实际上调用的是 v2 版本。

单精度矩阵乘法函数：`cublasSgemm_v2`

CUBLASAPI cublasStatus_t CUBLASWINAPI cublasSgemm_v2
(
    cublasHandle_t handle,
    cublasOperation_t transa, cublasOperation_t transb,
    int m, int n, int k,
    const float *alpha,
    const float *A, int lda,
    const float *B, int ldb,
    const float *beta,
    float *C, int ldc
);

函数签名：cublasStatus_t CUBLASWINAPI cublasSgemm_v2
- cublasStatus_t 是函数返回的状态类型。
- CUBLASWINAPI 是一个宏，定义了函数调用的约定。
参数说明：
- cublasHandle_t handle：cuBLAS 库上下文的句柄。
- cublasOperation_t transa：指定矩阵 A 是否需要转置或共轭转置。
- cublasOperation_t transb：指定矩阵 B 是否需要转置或共轭转置。
- int m：矩阵 C 的行数和矩阵 A 的行数（若不转置）。
- int n：矩阵 C 的列数和矩阵 B 的列数（若不转置）。
- int k：矩阵 A 的列数（若不转置）和矩阵 B 的行数（若不转置）。
- const float *alpha：标量 α。
- const float *A：指向矩阵 A 的指针。
- int lda：矩阵 A 的领先维度（行数）。
- const float *B：指向矩阵 B 的指针。
- int ldb：矩阵 B 的领先维度（行数）。
- const float *beta：标量 β。
- float *C：指向结果矩阵 C 的指针。
- int ldc：矩阵 C 的领先维度（行数）。

双精度矩阵乘法函数：`cublasDgemm_v2`

CUBLASAPI cublasStatus_t CUBLASWINAPI cublasDgemm_v2
(
    cublasHandle_t handle,
    cublasOperation_t transa, cublasOperation_t transb,
    int m, int n, int k,
    const double *alpha,
    const double *A, int lda,
    const double *B, int ldb,
    const d