Nsight Compute与nvprof metrics 对照

NVIDIA 计算能力7.5及以上的GPU设备不再支持nvprof工具进行性能剖析,提示使用Nsight Compute作为替代品,如下图所示。
在这里插入图片描述
Nsight Compute Cli(命令行)性能剖析的参数与nvprof不一样,当输入nvprof的参数抓取数据时,因为参数不识别,无法抓取希望得到的指标,如下图所示,因为输入nvprof的性能参数,无法识别,因此没有抓到有用信息;同时,Nsight Compute Cli性能参数成千上万,虽然可以将这些参数全部抓取,但是会对使用者筛选关注信息带来很大的麻烦。
在这里插入图片描述
因此,非常有必要找到两款工具性能参数之间的对应关系。这里记录命令行使用Nsight Compute Cli的方法以及两个工具常用参数之间的对应关系,方便查阅与工具间使用的过度。

Nsight Compute Cli上手说明

以执行可执行文件剖析性能为例,Linux系统上 Nsight Compute Cli使用格式为

ncu --metrics param  target

说明:param为要抓取参数,target为可执行文件。程序执行后会在终端输出抓取的信息,参考如下:
在这里插入图片描述
这里输入了正确的参数,可以看到核函数加载全局内存的吞吐量为46.13 GB/s.

Nsight Compute 与nvprof 参数映射

这里只整理了 SM占用率,全局内存,共享内存 三个方面常用参数对照关系,更多参数对照可以参考官方提供的CUDA手册《NSIGHT COMPUTE COMMAND LINE INTERFACE》。

SM占用率

nvprofnsight compute cli
achieved_occupancysm__warps_active.avg.pct_of_peak_sustained_active

全局内存读写

nvprofnsight compute cli
gld_throughputl1tex__t_bytes_pipe_lsu_mem_global_op_ld.sum.per_second
gst_throughputl1tex__t_bytes_pipe_lsu_mem_global_op_st.sum.per_second
gld_efficiencysmsp__sass_average_data_bytes_per_sector_mem_global_op_ld.pct (x)
gst_efficiencysmsp__sass_average_data_bytes_per_sector_mem_global_op_st.pct(x)
gld_transactionsl1tex__t_sectors_pipe_lsu_mem_global_op_ld.sum
gst_transactionsl1tex__t_sectors_pipe_lsu_mem_global_op_st.sum
gld_transactions_per_requestl1tex__average_t_sectors_per_request_pipe_lsu_mem_global_op_ld.ratio(x)
gst_transactions_per_requestl1tex__average_t_sectors_per_request_pipe_lsu_mem_global_op_st.ratio(x)

共享内存读写

nvprofnsight compute cli
shared_efficiencysmsp__sass_average_data_bytes_per_wavefront_mem_shared.pct(x)
shared_load_throughputl1tex__data_pipe_lsu_wavefronts_mem_shared_op_ld.sum.per_second
shared_load_transactionsl1tex__data_pipe_lsu_wavefronts_mem_shared_op_ld.sum.per_second
shared_load_transactions_per_requestn/a
shared_store_throughputl1tex__data_pipe_lsu_wavefronts_mem_shared_op_st.sum.per_second
shared_store_transactionsl1tex__data_pipe_lsu_wavefronts_mem_shared_op_st.sum.per_second
shared_store_transactions_per_requestn/a
  • 9
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值