CUDA学习之第五章共享内存和常量内存（二）

最新推荐文章于 2024-04-26 11:23:44 发布

网安菜13

最新推荐文章于 2024-04-26 11:23:44 发布

阅读量82

点赞数

分类专栏： cuda学习文章标签： gpu算力

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_49833809/article/details/132214925

版权

cuda学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

5.2 共享内存的数据布局

5.2.1 方形共享内存

声明二维共享内存变量（行主序存储）：

__shared__ int tile[N][N];

对于二维线程块，他有两种访问方式：

tile[threadIdx.y][threadIdx.x]
tile[threadIdx.x][threadIdx.y]

由于第一种访问方式邻近的线程会访问连续的地址，所以一个线程束内不会冲突存储体，所以他是比较好的方式。

5.2.1.1 行主序访问和列主序访问

原文举个例子来说明上面的第一个行主序时好的，给了一个线程块32*32的，一个二维共享内存tile[32][32]，在线程中给他赋值然后返给全局一维数组out。
通过共享内存读写和全局内存的写，在此中改变threadIdx.x和threadIdx.y 的顺序来比较时间，可以得知第一种更好。

5.2.1.2 按行主序写和列主序读

发现列主序读会存储体冲突。

5.2.1.3 动态共享内存

就是换成一维的了，结果和前面的一样，还是行主序的好。

5.2.1.4 填充静态声明的共享内存

将第二维度加了一个变成了tile[32][33]，可以发现两种方法都不会冲突了，但是要注意这是Fermi设备所以这样可以，对于Kepler设备中八位的内存会有差别，需要调整填充大小。

5.2.1.5 填充动态声明的共享内存

在计算一维索引时填充，需要注意在写到全局内存时要调整索引保证不会因为填充而写错。

5.2.1.6 方形共享内存内核性能的比较

得到结果是填充有效提高性能，因为他减少了存储体冲突，第二就是动态共享内存内核会增加少量的消耗。

5.2.2 矩形共享内存

这回是tile[Row][Col]，矩形的二维矩阵。和方形结果一样，后面不赘述了，代码中会有一些方便矩形的操作。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
CUDA学习之第五章共享内存和常量内存（二）

由于第一种访问方式邻近的线程会访问连续的地址，所以一个线程束内不会冲突存储体，所以他是比较好的方式。
复制链接

扫一扫

专栏目录

网安菜13 CSDN认证博客专家 CSDN认证企业博客

码龄4年

10: 原创

130万+: 周排名

30万+: 总排名

4509: 访问

: 等级

141: 积分

2: 粉丝

1: 获赞

7: 评论

17: 收藏

私信

关注

热门文章

分类专栏

最新评论

Zama文章之 TFHE深度解析-第一部分-密文形式
CSDN-Ada助手: 非常感谢您的分享，对于TFHE的深度解析让我受益匪浅。希望您能继续坚持创作，分享更多关于TFHE的知识，也期待您能在下一篇博客中加入更多实际案例分析，让读者更好地理解和应用TFHE。祝您创作顺利，期待您的下一篇精彩文章！
Zama文章之同态加密概论
CSDN-Ada助手: 恭喜您撰写了第11篇博客，标题为“Zama文章之同态加密概论”，内容涉及同态加密的概念及应用，非常有深度和价值。希望您能继续保持创作的热情和动力，为我们带来更多深入的技术解析和思考。建议您可以考虑从实际案例出发，结合具体的行业应用场景，为大家呈现更加生动和具体的内容。期待您的下一篇博客！
CUDA学习之第五章共享内存和常量内存（二）
CSDN-Ada助手: 恭喜你写了第10篇博客！标题中提到的共享内存和常量内存，是CUDA学习中非常重要的内容。你的文章给出了第五章的进一步解析，让读者更深入地理解了这两个概念。我觉得你的写作风格很清晰，能够将复杂的概念讲解得易于理解。不过，我想提个建议，希望你能在下一篇博客中加入一些实际的案例或者示例代码，这样读者可以更直观地体验到共享内存和常量内存的优势和应用场景。期待你的更多精彩文章！
CUDA学习之第五章共享内存和常量内存（一）
CSDN-Ada助手: 恭喜您撰写了第9篇博客！标题中提到的共享内存和常量内存是CUDA学习中非常重要的主题之一。通过深入研究和分享这些内容，您不仅加深了自己对CUDA的理解，也帮助了其他人更好地掌握这些概念。下一步，我建议您可以继续探索共享内存和常量内存的更高级用法和优化技巧，比如如何合理分配共享内存和常量内存的大小，以及如何在多个线程块之间共享数据等。此外，您还可以考虑分享一些实际案例，展示共享内存和常量内存在加速GPU计算中的实际效果。再次祝贺您的持续创作，期待您的下一篇博客！
CUDA学习之第四章：全局内存（一）
CSDN-Ada助手: 恭喜您完成第五篇博客！标题看起来很有吸引力，我很期待阅读您关于CUDA学习的系列文章。从全局内存的角度来探索CUDA，这个主题听起来非常有趣。在您的下一篇博客中，或许您可以进一步探讨全局内存的使用技巧，以及与其他内存类型的比较和优化方法。我相信您的深入研究和谦虚态度会使这个系列的文章更加出色。加油！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。