- grid ==> 网格;
- block ==> 线程块;
- 线程分块是逻辑上的划分,物理上线程不分块
- 配置线程: <<<grid_size, block_size>>>
- 最大允许线程块大小:1024
- 最大允许网格大小:2^31 - 1 (针对一维网格)
- 每个线程在核函数中都有一个唯一的身份标识;
- 每个线程的唯一标识由这两个 <<<grid_size, block_size>>> 确定;grid_size,block_size 保存在内建变量 (build-in variable),目前考虑的是一维的情况:
-
- gridDim.x:该变量的数值等于执行配置中变量 grid_size 的值;
- blockDim.x:该变量的数值等于执行配置中变量 block_size 的值;
- 线程索引保存成内建变量 (build-in variable):
-
- blockIdx.x:该变量指定一个线程在一个网格中的线程块索引值,范围为 0~gridDim.x-1;
- threadIdx.x:该变量指定一个线程在一个线程块中的线程索引值,范围为 0~blockDim.x-1;
- 比如 kernel_fun<<<2, 4>>>(),示意图如下。那么线程唯一标识:Idx = threadIdx.x + blockIdx.x * blockDim.x,其中 gridDim.x 值为 2、blockDim.x 值为 4、blockIdx.x 的取值范围为 0~1、threadIdx.x 的取值范围为 0~3;