遇到报错很苦恼
如何解决?
使用sudo权限,即使用sudo ncu来执行命令
又遇报错相当苦恼
如何解决?
-
应使用ncu的绝对路径,位于cuda安装目录的bin文件夹下,比如这样:/data/user/cuda113/bin/ncu (需自行替换,这里只是举例说明)
-
同理,此时python也应使用绝对路径(可以不用试试,会报类似上面的错误),位于conda安装目录下面的虚拟环境文件夹中,你想用哪个虚拟环境的python,就进入对应的目录寻找,比如这样:/data/user/conda/envs/py38/bin/python (需自行替换,这里只是举例说明)
-
根据前面的例子来说,最终命令是这样的:
sudo /data/user/cuda113/bin/ncu /data/user/conda/envs/py38/bin/python test.py
根据自己的需要,加入想要分析的内核,比如下面这样,分析名称为aaa或bbb的内核:
sudo /data/user/cuda113/bin/ncu -k "aaa|bbb" /data/user/conda/envs/py38/bin/python test.py