nvidia-smi面板参数如何看?

最近训练大模型经常监控卡的使用情况。常用到:

watch nvidia-smi

面板提供有关显卡硬件和驱动程序的信息,以及进行一些基本的管理和监控操作。

以下是面板中一些主要信息的解释:

GPUGPU的编号
NameGPU的型号
Fan期望的风扇转速以百分比形式显示,范围从0%到100%。实际的风扇转速可能会因风扇堵转或其他因素而低于这个值。
TempGPU的当前温度单位通常是摄氏度。
PerfGPU的性能状态从P0到P12。P0表示最大性能状态,而P12表示最小性能状态。
PwrGPU的当前能耗通常以瓦特为单位
Persistence-M持续模式如果持续模式为“on”,则能耗会更大,但新的GPU应用启动时耗时会更短。如果为“off”,则表示持续模式已关闭。
Bus-IdGPU的总线信息domain:bus:device.function(GPU 所在的 PCI 域:PCIe 总线编号:该总线上的设备编号:功能编号)
Disp.AGPU的显示是否已初始化(通常用于指示GPU是否正在驱动显示输出,例如连接到计算机的显示器。)
Memory Usage显存使用率当前显存的使用量和总显存大小。
Volatile GPU-UtilGPU的实际利用率通常以百分比表示。
Uncorr. ECC错误检查与纠正状态GPU是否启用了ECC功能,以及当前的ECC错误计数。(ECC通过在内存中增加额外的校验位来检测和纠正数据错误)
Compute MGPU的计算模式

DEFAULT:默认的计算模式,允许多个进程同时使用 GPU,但是可能会受到一定的性能限制。

EXCLUSIVE_PROCESS:一次只有一个进程可以使用 GPU,可以确保每个进程都能获得最大的性能。

PROHIBITED:GPU 的计算功能禁用,用于防止某些不需要计算的任务占用 GPU 资源。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值