【小伟哥AI之路】nvidia-smi之GPU状态监测命令详解

GPU状态监测 nvidia-smi 命令详解

在进行深度学习实验时,GPU 的实时状态监测十分有必要。今天详细解读一下 nvidia-smi 命令。

 

上图是服务器上 GeForce RTX 2080 Ti 的信息,下面一一解读参数。 
上面的表格中的红框中的信息与下面的四个框的信息是一一对应的:

GPU:GPU 编号; 
Name:GPU 型号; 
Persistence-M:持续模式的状态。持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态; 
Fan:风扇转速,从0到100%之间变动; 
Temp:温度,单位是摄氏度; 
Perf:性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能(即 GPU 未工作时为P0,达到最大工作限度时为P12)。 
Pwr:Usage/Cap:能耗; 
Memory Usage:显存使用率; 
Bus-Id:涉及GPU总线的东西,domain:bus:device.function; 
Disp.A:Display Active,表示GPU的显示是否初始化; 
Volatile GPU-Util:浮动的GPU利用率; 
Uncorr. ECC:Error Correcting Code,错误检查与纠正; 
Compute M:compute mode,计算模式。

下方的 Processes 表示每个进程对 GPU 的显存使用率。


第二个命令:nvidia-smi -L 

xsrt@xsrt-aiserver:/data1/volumes/mmxsrt/configs-us$ nvidia-smi -L
GPU 0: GeForce RTX 2080 Ti (UUID: GPU-55f98754-06b0-2a07-cb1a-e0eaef72ca5b)
GPU 1: GeForce RTX 2080 Ti (UUID: GPU-704b4fee-e154-f8a4-2642-3c43c73811a2)
GPU 2: GeForce RTX 2080 Ti (UUID: GPU-1aabf69c-d6b2-f8fe-b8da-038bdb66bf98)
GPU 3: GeForce RTX 2080 Ti (UUID: GPU-b29d44ab-301a-47d4-08fa-c23fd156bc22)
GPU 4: GeForce RTX 2080 Ti (UUID: GPU-76a0d672-6111-a734-2648-0c9087e0afed)
GPU 5: GeForce RTX 2080 Ti (UUID: GPU-452f42ea-2d67-7fd1-b5b8-4ff2198656d9)
GPU 6: GeForce RTX 2080 Ti (UUID: GPU-d68d5c9c-7a23-9318-146a-928d0aba4b5e)
GPU 7: GeForce RTX 2080 Ti (UUID: GPU-77adfa60-4d8c-bec4-f4ba-2760399010b8)
xsrt@xsrt-aiserver:/data1/volumes/mmxsrt/configs-us$ 

该命令用于列出所有可用的 NVIDIA 设备信息。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值