文章目录
关键命令
cat /var/emu_param/bluefield_temp
cat /var/emu_param/fw_info
cat /var/emu_param/nic_pci_dev_info
-c路径是:`/etc/ipmi/mlx-bf.lan.conf`
-f路径是:`/etc/ipmi/mlx-bf.emu`
背景
普通服务器可以通过IPMI进行管理,IPMI依赖专门的硬件BMC提供。在DPU上使用ipmi_sim来模拟IPMI行为。
对于Bluefield DPU通过ipmitool远程登录管理一直报错不支持。应该就是没有ipmi的专门硬件,仅仅通过sim的方式,然后在内核态运行ko提供功能查询支持。
基础介绍
ipmi_sim 是一个IPMI(Intelligent Platform Management Interface,智能平台管理接口)模拟器。它能够模拟BMC(Baseboard Management Controller,基板管理控制器)的行为,允许用户在没有物理硬件的情况下测试和开发IPMI相关的软件和脚本。
在BF2和BF3都存在一个特殊的守护进程ipmi_sim:
ipmi_sim介绍:
可以看到-c指定了cofnig文件,以及-f指定了cmd文件。
-c路径是:/etc/ipmi/mlx-bf.lan.conf
-f路径是:/etc/ipmi/mlx-bf.emu
ipmi_sim的两个关键文件和相关文件:
/etc/ipmi/mlx-bf.lan.conf:
/etc/ipmi/mlx-bf.emu:
可以看到执行一些命令,并且将数据映射到文件中。
关键目录在/var/emu_param/ ,在BF3上,该目录被移动到了 /run/emu_param目录
/var/emu_param/ 的一些关键文件们
cat /var/emu_param/nic_pci_dev_info
可以查看PCIe的一些信息,比如busid以及vendorid,尤其是经典的15b3(从这里可以看到BF系列是Mellanox被NV收购前就在定义了)
cat /var/emu_param/mmc_partitions
查看mmc上的分区信息
cat /var/emu_param/fw_info
可见这个信息是非常全的信息了。
能够看到OFED的版本。有PCIe的详细信息,能看到设备的配置,比如:
- 200GbE single-port QSFP56
- PCIe Gen4 x16
- Secure Boot Disabled
- Crypto Enabled
- 16GB on-board DDR
- 1GbE OOB
- HHHL 挡板连封装类型都有
- Part number型号
- Serial number序列号
- FW的version:connectx_fw_ver: 24.31.0356
- 设备的PSID: board_id: MT_0000000809
- 设备的guid: node_guid: b8ce:f603:00fc:53f0
cat /var/emu_param/bluefield_temp 设备温度
所以除了通过ipmitool sdr list还能直接读取温度
其他
关于ipmi的几个ko文件:
综述
本文通过探索ipmi_sim守护程序的参数,查看在Bluefield DPU上是如何支持ipmi协议。