5. Device property查询
- 在cuda编程中,要想编写出适合不同计算能力的并行程序,属性查询是必学的一部分。
- 下表给出了
cudaruntime.h
中的动态查询属性:
Property | Explanation |
---|---|
name | descreption |
Major/minor | 计算能力 5.2 -> 5/2 |
totalGlobalMem | 总全局内存的大小 |
maxThreadsPerBlock | 每个block的最大线程数 |
maxThreadsDim[3] | block形状的边界 |
maxGridSize[3] | gride形状的边界 |
clockRate | 时钟频率(kHz) |
sharedMemPerBlock | 每个block的共享内存的大小 |
Warp size | 流多处理的流限制 |
- 代码实现:
kernel.cu
#include "cuda_runtime.h"