cuda程序测试:nvprof工具的使用。持续更新中……

nvprof的使用:

首先保证使用nvcc编译器将源程序编译为可执行程序

接着执行命令:nvprof ./executablePro

profiling result中显示的是kernel执行的time情况

 

api calls则显示的是程序调用的api所耗费的time情况

 

一般对kernel进行分析时,看profiling result中的结果。

此外,还可以测试程序的其他性能参数:

 

achieved_occupancy参数:每个sm在每个cycle能够达到的最大activewarp 占总warp的比例。

nvprof --metrics achieved_occupancy ./executablePro

 

gld_throughput: global load throughput (查看memory 的throughput)

nvprof --metrics gld_throughput ./executablePro

 

gld_efficiency: global memory loadefficiency: device memory bandwidth的使用率

nvprof –metrics gld_efficiency ./ executablePro

 

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值