一 安装
参考
nsight-compute使用教程-CSDN博客https://blog.csdn.net/youzjuer/article/details/142549332
二 使用
nsys profile -t cuda,nvtx --force-overwrite true -o xxxx python xxx.py
xxxx表示生成文档的名字
如果是cuda c 则 python xxx.py替换为./xxx即可
这个命令主要是使用Nsight Systems的nsys命令来进行性能分析。通过使用这个命令,我们可以分析CUDA应用程序的性能,捕获CUDA和NVTX的相关信息,并生成相应的性能分析文件以供进一步分析和优化。
nsys profile:这部分指明要使用nsys命令以进行性能分析。
-t cuda,nvtx:这个选项表示在分析中包含CUDA和NVTX(NVIDIA Tools Extension)的信息。CUDA是NVIDIA的并行