nvcc这个大家都很熟悉了,是cuda代码的编译器。
nvprof这个是cuda代码的性能分析工具,具体我不详细介绍了,感兴趣的可以自己搜索!
我这里只介绍怎么去使用nvcc和nvprof
这两个工具只要下载安装了cuda就可以出现了,默认情况下在如下路径中可以找到:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\bin
我们的命令(参考链接:我的第一份CUDA代码)如下:
那么我们从上面发现我们在windows10下必须要把nvcc.exe和nvprof.exe添加到系统环境变量中:
因此这时我们是可以直接在cmd控制台界面上使用的。我以我自己的vs2019 cuda项目test_add工程为例:
编译cuda文件并运行如下:
那我们使用nvprof进行速度测试:
nvprof add_cuda
则出现如下错误:
于是我们可以根据如下链接:CUDA无法使用nvprof:由于找不到cupti64_2020.2.0.dll - AIxiaodi - 博客园
将C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\extras\CUPTI\lib64下的文件cupti64_2020.1.1.dll 复制到路径 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\bin中即可,如下:
好了,那么再次运行
nvprof add_cuda
结果如下:
至此,就得到了nvprof的性能分析表!