背景:
分析CUDA程序的GPU占用情况。除了使用常见的clock、gettimeofday计时分析程序的效率之外,还可以使用nvidia推出的nvprof进行具体的GPU指令耗时分析,为了方便分析,可以使用nvidia visual profiler对nvprof生成的分析报告进行可视化。
官方链接:https://developer.nvidia.com/nvidia-visual-profiler
准备:
Window 10环境下的nvprof工具生成待可视化的目标文件(*.nvvp文件)。
指令:nvprof -o test_profile ./test
Nvidia Visual Profiler nvvp安装
这部分坑太多了,详细记录。
1. 安装 nvidia visual profiler
nvvp在安装CUDA Toolkit的时候会自带安装,在%CUDA_PATH%\Development\libnvvp下。
本人的是自带的,直接点击.exe就能运行。
如果没有,到官方链接:https://developer.nvidia.com/nvidia-visual-profiler
点击下载Download按钮&#x