cuda编程之共享内存的bank冲突

数据猴赛雷

已于 2022-08-10 00:48:08 修改

阅读量1.2k

点赞数 1

分类专栏： cuda 文章标签： cuda

于 2022-08-10 00:46:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/benben044/article/details/126258227

版权

cuda 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1、本文参考:

（1）共享内存之bank冲突 - SegmentFault 思否

这篇文章写的最好，但是有几处错误会单独指出

（2） CUDA GPU编程如何避免Bank conflict_Luchang-Li的博客-CSDN博客_bank conflict

（3）「CUDA ON ARM」如何避免共享内存 Bank conflict - 知乎

2、第一篇文章错误之处

这里，应该是线程0与线程16都访问到了bank 0，线程1与线程17都访问到了bank 2。

因为：假如(s * (tid + n)) % 32 = (s * tid + s * n) % 32 = (s * tid) % 32 成立，则 s * n 为32的整数倍。而当stride=2时，n取16时 s * n 即为32的整数倍，所以tid + 16 与 tid访问的bank是相同的。

3、warp与bank的关系如下：

Shared memory 被分割为 32 个逻辑块（banks），不同的逻辑块可以被多个线程同时访问。

warp为线程束的概念。

4、解决bank冲突的办法

s为奇数。当s为奇数时，在n < 32时很难构建s * n为32的整数倍。

对于方式2，二维数组的定义为：

__shared__ int Vector1[32][6];

当每个线程同时访问自己向量的第一个元素时，其访问字地址为：tid * 6 + 0，对应的bank为(tid * 6 + 0) % 32，即stride=6，如果s * n 为32的整数倍，则n可取16。于是线程0和线程16，线程1和线程17会产生bank 2路冲突。

此时，若将二维数组的定义改为:

__shared__ int Vector1[32][7];

此时stride=7，就不会产生bank冲突了。

数据猴赛雷

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
cuda编程之共享内存的bank冲突

bank冲突说明
复制链接

扫一扫

专栏目录

数据猴赛雷 CSDN认证博客专家 CSDN认证企业博客

码龄15年

138: 原创

3万+: 周排名

1万+: 总排名

26万+: 访问

: 等级

2099: 积分

566: 粉丝

483: 获赞

66: 评论

1275: 收藏

私信

关注

热门文章

分类专栏

游戏 7篇
java 16篇
神经网络 61篇
日记
spark 2篇
AIGC 9篇
windows工具 1篇
前端 7篇
容器技术 2篇
python 4篇
cuda 1篇
Android应用开发 7篇
android 1篇
InstrumentationTestCase 1篇
实例 1篇
源码 1篇
webkit 1篇

最新评论

LangChain调用tool集的原理剖析（包懂）
Horikyouko: 去langchain官网看一下文档？或者运行的时候就会有warning提示你当前调用已经不适用了，应该用什么什么
LangChain调用tool集的原理剖析（包懂）
极地星辰: 您好，请问这里的langchain是什么版本呢，我自己装的langchain发现没有from langchain.agents import AgentType这个库
Java文字描边效果实现
山闻愚: 大神，ImageUtil 这你用的是哪个包
windows11下运行swin-transformer算法
阿燃定律: 您好，想问一下，torch.distributed.init_process_group('gloo', init_method='file://tmp/somefile', rank=0, world_size=1)，这里的init_method是什么？
LPRNet算法说明
伊乐宝宝: 数据集少

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。