如何查看gpu资源

命令:

nvidia-smi

可以看到下图:

现在来解释一下每一栏代表什么,因为题主总是记不住所以来做个笔记....

标题行是要横着看的,新人可能会先竖着再横着看,例如GPU和Fan是两个不太相关的东西...

显而易见的就不解释了,GPU表示卡的序号,Fan表示风扇的工作百分比,Name一大长串的就是你的卡的名字,图中是 NVIDIA GeForce RTX 3090,Temp是GPU当前的工作温度,24C就是24°C,正常GPU的工作温度在40°C到85°C之间,Perf (Performance State)是当前GPU的性能状态,取决于负载和散热,从P0到P12不等,数字越高说明性能越高。

Persistence-M表示持久模式,持久模式允许在空闲时保持GPU的驱动程序加载状态,减少重新初始化GPU的时间。Pwr: Usage/Cap 是GPU的当前功率使用情况和最大功率限制。例如 100W / 320W,表示GPU当前使用100瓦,最大可使用320瓦。

Bus-Id 表示GPU通过哪条总线(如PCIe)与CPU进行通信。该信息对于调试和多GPU设置时很有用。Disp.A 表示表示该GPU是否正在处理显示输出(如桌面渲染),关闭时可能仅用于计算。Memory-Usage 已用显存/总显存,有时候提示显存不够就该看这里了。

Volatile Uncorr. ECC 记录在GPU中发生的不可恢复的ECC(错误纠正码)错误。ECC用于检测和修复内存中的错误。GPU-Util 当然是GPU使用率啦,猜猜现在还能用几张卡【狗头】。Compute M. 是否处于计算模式,如果是Exclusive_Process,只允许一个计算进程使用该GPU。MIG M. 是否启用了MIG(Multi-Instance GPU)模式,允许将GPU分割成多个独立的计算实例,以便多个用户同时使用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值