cuda 任意维度的矩阵相乘

最新推荐文章于 2024-07-25 04:42:50 发布

preston2006

最新推荐文章于 2024-07-25 04:42:50 发布

阅读量1k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/preston2006/article/details/9794125

版权

该博客介绍了如何使用CUDA进行任意维度的矩阵相乘操作。通过设置合适的维度大小（wA, wB, hA），利用dim3结构定义线程网格和线程块，并调用matrixMul核函数在GPU上执行矩阵乘法。" 102824175,4755197,Excel列字母转换：从A到ZZZ的base26实现,"['编程算法', 'Excel', 'base26转换', '递归算法', '循环结构']

摘要由CSDN通过智能技术生成

__global__ void matrixMul( float* A, float* B, float* C, int hA,int wA, int wB)
{
int bx = blockIdx.x;
int by = blockIdx.y;
int tx = threadIdx.x;
int ty = threadIdx.y;

float Csub = 0.0f;

for (int j=0;j<wA;j+=BLOCK_DIM)
{
__shared__ float AS[BLOCK_DIM][BLOCK_DIM];
__shared__ float BS[BLOCK_DIM][BLOCK_DIM];

if(((by*BLOCK_DIM+ty)<hA)&&((tx+j)<wA))

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

preston2006 CSDN认证博客专家 CSDN认证企业博客

码龄17年

61: 原创

111万+: 周排名

189万+: 总排名

9万+: 访问

: 等级

1553: 积分

21: 粉丝

14: 获赞

18: 评论

23: 收藏

私信

关注

热门文章

分类专栏

个人编程 1篇
vc 4篇

最新评论

yael
qq_42520689: 博主您好，yael的下载链接打不开了。可以分享一下yael吗，万分感谢！
FFMPEG release版本编译出错
Tisfy: 这篇帖子，就好比黑暗中刺裂夜空的闪电
linux 编译flann-1.8.4-src（matlab）
gakki_Yuibo: 还是无法编译找不到文件
DPM
qq_38972038 回复 Zhang_Sir_Coder: 这是5 6年前的博客你还指望博主回复你吗(づ ●─● )づ
DPM
Zhang_Sir_Coder: 请问博主能否详细说明一下not enough space 问题的解决方法？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。