HW | AMD GPU上 “nvidia-smi -lms” 的等价指令——MI300X实时查看GPU使用率

.

实验背景

最近在使用AMD MI300X GPU进行实验,MI300X是目前AMD最先进的几款数据中心GPU之一。该GPU的软件指令和NVIDIA的不同,主要因为底层的驱动命名不同(在我理解确实是这样一个比较简单的原因 > - <,深究的话就是AMD自研的硬件+软件系统也创建了专属的特定IP)。

不同于NVIDIA的CUDA生态,AMD采用HIP+ROCm硬件到软件编程架构,所以大部分常用的指令两者会有对应关系。这篇博客就以最常用的场景之一——实时查看GPU的使用情况——而展开。

查看GPU的使用情况的常见场景:

  1. 部署模型推理
  2. 模型训练
  3. 图形渲染,等。

.

nvidia-smi -lms

在NVIDIA GPU上,我们通常使用nvidia-smi来查看和观察GPU使用率。为了实时观察使用率,我们可以增加参数–lms动态刷新GPU使用率。

具体指令如下:

nvidia-smi -lms

.

rocm-smi 等价指令

在AMD GPU上,rocm-smi是对应的等价指令。在实际使用中会发现,目前rocm-smi还不支持实时观察使用率的-lms参数(也许未来会有其他发现再更新)。

结合GPT给出的建议,可以使用watch指令进行实时观测,实现同样的功能。

具体指令如下:

watch -n 1 rocm-smi

指令含义是执行rocm-smi,并刷新显示结果,刷新率为1秒/次。

.

结语

目前GPU生态蓬勃发展,期待各种改进。以上。

.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值