cublasSgemm实现矩阵的相乘

本文介绍了在使用cublasSgemm进行矩阵相乘时,由于CUBLAS按照列主序存储矩阵,需要理解矩阵转置的概念。通过实例解释了如何处理矩阵A和B,确保正确计算C=A*B。同时,提醒注意cublasSgemm参数设置,防止因参数错误导致计算结果不正确。
摘要由CSDN通过智能技术生成

       今天想调用cuda的库函数实现矩阵的相乘,但是发现在cublasSgemm中矩阵是按照列主元素进行存储的,也就是一列列的存储的。这和c中一般按照行存储完全相反,后面看了一个帖子http://cudazone.nvidia.cn/forum/forum.php?mod=viewthread&tid=6001&extra=&page=2讲了一个方法,后面理了一下,具体分析如下:

比如,我们想求C=A*B这个矩阵运算,其中A={ {1,1},{2,2},{3,3}};B={ {1},{1}};C={ {4},{5},{6}},而对于A、B、C进行一维数组表示有A={1,1,2,2,3,3},B={1,1},C={4,5,6};这个在c/c++是和前面表示一样,但是在cublasSgemm中就完全不对了,那么这个一维的A其实表示的是{ {1,2,3},{1,2,3}};可以看到两个矩阵其实刚好是转置关系。那么我们要求C=A*B,按照一维数据输入的话结果A表示的是AT,B表示的是BT,所以我们要输入的是AT和BT,这样在公式中得到的才是A*B.假设这是得到矩阵C=A*B,但是C也是按列存储的,我们要的是CT,而CT=BT*AT,而这里的BT其实就是原矩阵B,AT其实就是原矩阵A。可见,我们通过交换AB的顺序就可以得到按行存储的C。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值