华为 RH2288H V3服务器4个风扇同时告警案例
问题描述
硬件配置: RH2288H V3服务器。
客户反馈BMC中4个风扇同时有告警:
告警信息
客户反馈BMC中4个风扇同时有告警:
处理过程
排查步骤如下:
1) 重新安装4个风扇,问题未解决。
2) 查看当前BMC版本为1.91,升级到2.01后,问题未解决。
3) 询问客户近期是否有安装高功耗设备,反馈只新增了部分内存和两块82599网卡,且不确认何时产生告警。
4) 检查部件信息,PCIe设备只有两块82599网卡,无高功耗设备:
5) 检查部件信息,风扇型号为8056(BOM:02310YKN):
6) 检查部件信息,CPU配置为2颗E5-2690 V3:
7) 查看出厂记录,出厂时CPU配置为1颗E5-2620 V3:
8) 从以上信息可知,风扇告警原因是出厂时低功耗的CPU E5-2620 V3(TDP:85W)被改配成了高功耗的CPU E5-2690 V3(TDP:135W),而风扇没有从适配低功耗的8056型号(BOM:02310YKN)改配成适配高功耗的8056+型号(BOM:02310YKP),从而导致BMC中风扇告警。
根因
CPU从低功耗型号改配成高功耗型号,而风扇型号没有对应调整,导致BMC中出现风扇告警。高功耗的CPU搭配8056风扇使用从而导致BMC中4个风扇同时告警。
解决方案
将风扇从8056(BOM:02310YKN)换成8056+(BOM:02310YKP)。
建议与总结
同时4个风扇出现告警,可以从以下几个方面排查:
1)安装了不支持的风扇;
2)安装了当前风扇不支持的PCIE卡(高功耗散热搞不定);
3)安装了当前风扇不支持的CPU(高功耗散热搞不定);
4)不同型号的风扇混插。