1 想法
不为别的,下次再有为什么优化不行,也能有理有据,生动直观。减轻对于sanity值的消耗。
2 实践
Ubuntu的Nvidia官方镜像安装,可以自搜,本站有。nsys版本号如下:
NVIDIA Nsight Systems version 2023.1.1.127-32365746v0
2.1 CLI命令
这里只介绍几个可能常用的,因为主要还是用GUI,以防个人电脑出现各种问题(主要是连接不了内网,然后SSH用不了,你知道的,这对一个颠沛流离的人来说,是一件常有的事情)。
nsys profile:
开始一个新的性能分析会话。这是最常用的命令,主要用于收集应用程序的性能数据。
-o <output>
:指定输出文件名。-t <trace>
:指定要跟踪的活动(例如,cuda,opengl,osrt 等)。--duration <seconds>
:设置采集数据的持续时间。
nsys launch:
与 nsys profile
类似,但可以直接指定应用程序命令和参数
<application>
:指定要启动的应用程序。<arguments>
:为应用程序提供的命令