CUDA中grid、block、thread的设置简介

最新推荐文章于 2023-10-18 20:09:26 发布

小德山

最新推荐文章于 2023-10-18 20:09:26 发布

阅读量2.4k

点赞数 2

分类专栏： CUDA 文章标签： CUDA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/alualu628628/article/details/103997641

版权

CUDA 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文参考https://blog.csdn.net/hujingshuang/article/details/53097222上的内容

不同在于，本文将对原文进行补充，同时澄清一些易混淆的概念

CUDA中

grid、block、thread只要在最大值范围内，可以随意设置，最后系统会根据内部算法重新分配。因此grid、block、thread的设置其实只以你的“目的”有关。也就是说这几个值的索引如何方便如何来，要处理的矩阵就用二维，要处理的向量就用一维，要处理的张量就用三维

在设置上，变量是遵循向下设置的，即

dim3 grid(1, 1, 1)表示的是一个grid由一个block组成

dim3 grid(4, 1, 1)表示的是一个grid由四个一维block组成，不要混淆为有4个grid

block(8, 1, 1)表示的是一个block由1维thread组成，1乘8的一维分布，不要混淆为有8个block

block(4, 2, 1)表示的是一个block由2维thread组成，4乘2的二维分布，不要混淆为有4个长度为2的block

这就是为什么没有threadDim.x，threadDim.y，threadDim.z的原因，如果你在window下配置CUDA，用VS编写的时候会发现没有threadDim变量

threadIdx.x，blockIdx.x，gridIdx.x下标都是从0开始

因为本质上是在网格索引，所以从x方向开始查找和从y方向开始查找结果是一样的。对于一个block(4, 2, 1)而言

int tid = threadIdx.x*blockDim.y + threadIdx.y;

int tid = threadIdx.y*blockDim.x + threadIdx.x;

以上两个索引结果等价。

在索引的时候要计算，不要自己套公式，例如：

dim3 grid(8, 1, 1), block(2, 1, 1); 的情况，索引就是：

int tid = blockIdx.x * blockDim.x + threadIdx.x;而不是原文中的blockIdx.x * gridDim.x + threadIdx.x，原文只是恰巧gridDim.x = blockDim.x = 4 而已

在dim3 grid(2, 2, 1), block(2, 2, 1); 这种block和thread都是二维分布的情况下：

int tid = (blockIdx.y * gridDim.x + blockIdx.x)*(blockDim.x * blockDim.y)
+ threadIdx.y*blockDim.x + threadIdx.x;

int tid = (blockIdx.x * gridDim.y + blockIdx.y)*(blockDim.x * blockDim.y)
+ threadIdx.x*blockDim.y + threadIdx.y;

以上是等价的

在三维情况下，更是多种等价的查询，比如可以走列切片，或是走横切片，或是走高度切片，其实意义不大，只要按顺序索引就行。

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
CUDA中grid、block、thread的设置简介

本文参考https://blog.csdn.net/hujingshuang/article/details/53097222上的内容不同在于，本文将对原文进行补充，同时澄清一些易混淆的概念CUDA中grid、block、thread只要在最大值范围内，可以随意设置，最后系统会根据内部算法重新分配。因此grid、block、thread的设置其实只以你的“目的”有关。也就是说这几个值...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。