cublas库实现矩阵乘法（任意维数）

最新推荐文章于 2024-08-19 17:03:49 发布

qq632544991p

最新推荐文章于 2024-08-19 17:03:49 发布

阅读量2.4k

点赞数

分类专栏： gpu并行计算 c++

本文链接：https://blog.csdn.net/qq632544991p/article/details/49894005

版权

本文介绍了如何使用CUBLAS库在GPU上进行高效的矩阵乘法运算，特别强调了cublasSgemm函数的使用细节，包括参数含义和矩阵存储方式。通过示例代码展示了从主机到设备的数据传输、矩阵乘法的执行以及结果的回传，帮助理解CUBLAS在处理任意维度矩阵乘法时的注意事项。

摘要由CSDN通过智能技术生成

话不多说，直接进入主题

cublas是CUDA上矩阵运算的库，可以在gpu上实现很高的效率。然而关于它的使用，并没有详细的中文资料

笔者，经过多次调试成功，分享一点儿心得

#include <iostream>
#include <cstdlib>
#include <cublas_v2.h>
// Multiply the arrays A and B on GPU and save the result in C
// C(m,n) = A(m,k) * B(k,n)
//计算过程
void gpu_blas_mmul(const float *A, const float *B, float *C, const int m, const int k, const int n) {
int lda=m,ldb=k,ldc=m;
const float alf = 1;
const float bet = 0;
const float *alpha = &alf;
const float *beta = &bet;

// Create a handle for CUBLAS
cublasHandle_t handle;
cublasCreate(&handle);

// Do the actual multiplication
cublasSgemm(handle, CUBLAS_OP_N, CUBLAS_OP_N, m, n, k, alpha, A, lda, B, ldb, beta, C, ldc);

// Destroy the handle
cublasDestroy(handle);
}

int main(){
int row1=5;
int column1 &#