nvidia-smi信息详解
实用命令:
#帮助 nvidia-smi -h
#持续监控gpu状态 (-lms 可实现毫秒级监控) nvidia-smi -l 3 #每三秒刷新一次状态,持续监控
#列出所有GPU,大写L nvidia-smi -L
#查询所有信息 nvidia-smi -q
#查询特定卡的信息,0.1.2.为GPU编号 nvidia-smi -i 0
#显示特定的信息 MEMORY, UTILIZATION, ECC, TEMPERA-TURE, POWER, CLOCK, COMPUTE, PIDS, PERFORMANCE, SUPPORTED_CLOCKS, #PAGE_RETIREMENT, ACCOUNTING 配合-q使用 nvidia-smi -q -d MEMORY
#监控线程 nvidia-smi pmon
#监控设备 nvidia-smi dmon
#此外还有一系列可以配置模式的属性,可以直接利用nvidia-smi配置
#详情:http://developer.download.nvidia.com/compute/DCGM/docs/nvidia-smi-367.38.pdf
#查询命令外的配置命令,请慎重使用!!!
#对于配置类命令,务必事先确认命令的含义!!!
参数解释:
表格中会显示显卡的一些信息,第一行是版本信息,第二行是标题栏,第三行就是具体的显卡信息了,如果有多个显卡,会有多行,每一行的信息值对应标题栏对应位置的信息。
- GPU:编号,这里是0和1
- Fan:风扇转速,在0到100%之间变动,第一个是29%
- Name:显卡名,这里两块都是GeForce
- Temp:显卡温度,第一个是60摄氏度
- Perf:性能状态,从P0到P12,P0性能最大,P12最小
- Persistence-M:持续模式的状态开关,该模式耗能大,但是启动新GPU应用时比较快,这里是off
- Pwr:能耗
- Bus-Id:GPU总线
- Disp.A:表示GPU的显示是否初始化
- Memory-Usage:显存使用率
- GPU-Util:GPU利用率,第一个是74%,第二个未用
- Compute M.:计算模式