CUDA之矩阵乘法——TILE&sharedmemory

最新推荐文章于 2024-07-25 04:42:50 发布

Sumujingling

最新推荐文章于 2024-07-25 04:42:50 发布

阅读量3.3k

点赞数

分类专栏： CUDA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Sumujingling/article/details/51496236

版权

本文介绍了如何在CUDA中通过TILE分块和shared memory技术实现矩阵乘法，通过代码示例展示并行计算过程，并验证了结果与MATLAB计算的一致性。

摘要由CSDN通过智能技术生成

CUDA 矩阵乘法

将输入数据分成很多个TILE使用shared memory进行并行计算

矩阵乘法分块计算

代码

#include "device_functions.h"
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <stdio.h>
#include <iostream>
typedef struct {
    int width;
    int height;
    int stride;
    float* elements;
} Matrix;

#define BLOCK_SIZE  16
#define N           3072

__device__ float GetElement(const Matrix A, int row, int col) {
    return A.elements[row * A.stride + col];
}

__device__ void SetElement(Matrix A, int row, int col, float value) {
    A.elements[row * A.stride + col] = value;
}

__device__ Matrix GetSubMatrix(Matrix A, int row, int co

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Sumujingling CSDN认证博客专家 CSDN认证企业博客

码龄10年

18: 原创

24万+: 周排名

167万+: 总排名

9万+: 访问

: 等级

867: 积分

58: 粉丝

32: 获赞

10: 评论

110: 收藏

私信

关注

热门文章

分类专栏

CUDA 8篇

最新评论

CUDA之窄带常规波束形成
大江东第一深情: 你好博主，请问可以分享一下整体代码吗，请问您在学习CUDA的时候有没有相关的讨论群呢，目前我也在做波束形成这一块，希望您能够给点建议和帮助，谢谢！
Matlab之宽带波束形成
李辉豹: 你好，可以多一些分享吗？非常感谢！
Matlab之宽带波束形成
なし: 倪好啊，请问你的BTR图研究出来了？
MATLAB之波束形成学习
ah_yl: csdn在玩啥，把你文章设为VIP专属看不了了，麻烦博主能再发一次吗。感谢
MATLAB之波束形成学习
努力喽: 你好，我想问一下最后得到的w是什么，是11个阵元在64个子频带上的延时吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。