nvprof工具使用及结果分析,持续更新。。。

4 篇文章 0 订阅
3 篇文章 0 订阅

会持续更新。。。

1.介绍


nvprof是用来测试了解并优化CUDA或OpenACC应用程序的性能的分析工具。分析工具使您能够从命令行收集和查看分析数据。

2.基本使用

2.1测试程序时间性能


nvprof ./a.out
a.out为编译后的可执行文件

示例结果如下:
实例程序结果


2.2结果分析


  • Profiling result:是GPU(kernel函数)上运行的时间
  • API calls:是在cpu上测量的程序调用API的时间

3 --metrics参数的使用


3.1 occupancy

nvprof --metrics achieved_occupancy ./a.out

3.2 gld_throughput

nvprof --metrics gld_throughput ./a.out

3.3 gdl_efficiency

nvprof --metrics gld_efficiency ./a.out

4 解决工具报错

4.1 Error: unified memory profiling failed.

nvprof ./a.out  改为
nvprof --unified-memory-profiling off ./a.out 

这是因为某块内存被设置为了不允许分析,所以需要加–unified-memory-profiling off选项


参考文章


http://www.bubuko.com/infodetail-1120850.html
官网:https://docs.nvidia.com/cuda/profiler-users-guide/

  • 4
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值