nvidia-smi系列命令

#帮助
nvidia-smi -h

#持续监控gpu状态 (-lms 可实现毫秒级监控)
nvidia-smi -l 3 #每三秒刷新一次状态,持续监控

#列出所有GPU,大写L
nvidia-smi -L

#查询所有信息
nvidia-smi -q

#查询特定卡的信息,0.1.2.为GPU编号
nvidia-smi -i 0

#显示特定的信息 MEMORY, UTILIZATION, ECC, TEMPERA-TURE, POWER, CLOCK, COMPUTE, PIDS, PERFORMANCE, SUPPORTED_CLOCKS, #PAGE_RETIREMENT, ACCOUNTING 配合-q使用
nvidia-smi -q -d MEMORY

#监控线程
nvidia-smi pmon

#监控设备
nvidia-smi dmon

cmd中输入nvidia-smi输出内容中的GPU状态如下:
在这里插入图片描述
红色框中的为列名,同一列中(如下图),相同颜色框相对应,如:GPU对应0,1(双卡),Name对应GeForce RTX 2080,Temp对应68C和81C。
在这里插入图片描述
GPU:显卡编号;
Fan:风扇转速(0%–100%),N/A表示没有风扇;
Name:显卡型号名称;
Temp:显卡温度,(GPU温度过高会导致GPU频率下降);
Perf:性能级别,从P0(最大性能)到P12(最小性能);
TCC/WDDM:NVIDIA 高性能 GPU(如Tesla, Quadro)可以配置为 TCC(Tesla Compute Cluster)模式或 WDDM(Windows Display Driver Model)模式。 二者区别在于,TCC 模式下,GPU完全用于计算,并不需要本地显示功能;而 WDDM 模式下,GPU 同时扮演计算卡 + 显卡的角色;
Pwr:Usage/Cap:当前功率/总功率;
Bus-Id:总线ID;
Disp.A:显式初始化,Display Active,表示GPU的显示是否初始化;
Memory-Usage:显存使用情况;
Volatile Uncorr. ECC:是否开启错误检查和纠正技术,N/A表示不开启;
GPU-Util:GPU使用用率(不是显卡内存的占用率);
Compute M:GPU的计算模式

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值