当前线程在板块中的编号threadIdx
一个板块中的线程数量blockDim
当前板块的编号blockIdx
总的板块数量gridDim
线程(thread):并行的最小单位
板块(block):包含若干个线程
网格(grid):指整个任务,包含若干个板块
从属关系:thread < block < grid
调用方法kernel<<<gridDim, blocckDim>>>
,比如
kernel<<<2, 3>>>
那么调用的板块数量为2,每个板块中的线程数量是3,那么线程总数是6。
如果需要获取总的线程编号:blockDim * blockIdx + threadIdx
如果需要获取总的线程总数:blockDim * gridDim
下面代码可以进行展示
#include <cstdio>
#include <cuda_runtime.h>
__global__ void kernel() {
unsigned int tid = blockIdx.x * blockDim.x + threadIdx.x;
unsigned int tnum = blockDim.x * gridDim.x;
printf("Flattened Thread %d of %d\n", tid, tnum);
}
int main() {
kernel<<<2, 3>>>();
cudaDeviceSynchronize();
return 0;
}
结果为
Flattened Thread 3 of 6
Flattened Thread 4 of 6
Flattened Thread 5 of 6
Flattened Thread 0 of 6
Flattened Thread 1 of 6
Flattened Thread 2 of 6