- 命令行查看核函数消耗的寄存器和共享内存数量
nvcc --ptxas-options=-v reduce_sum.cu
- nvprof 使用
由于 8.0 及以上计算能力的显卡用不了 nvprof,官方建议用 nsight system 和 ncu,但是如果只想命令行打印表格查看 kernel 概况感觉还是 nvprof 方便,使用方法:
nsys nvprof ./reduce_sum
nvcc --ptxas-options=-v reduce_sum.cu
由于 8.0 及以上计算能力的显卡用不了 nvprof,官方建议用 nsight system 和 ncu,但是如果只想命令行打印表格查看 kernel 概况感觉还是 nvprof 方便,使用方法:
nsys nvprof ./reduce_sum