1.检查bmc日志发现,所有Mezz卡都在位且状态正常:
Mezz Card Info
Slot | BoardId | Name | Manufacturer | PCB Ver | Card Desc
1 | 0x80 | MZ110 | Huawei | .B | 4*GE Port Mezzanine Card
2 | 0x95 | MZ220 | Huawei | .B | 2*16G FC Port Mezzanine Card
3 | 0x80 | MZ110 | Huawei | .B | 4*GE Port Mezzanine Card
4 | 0x95 | MZ220 | Huawei | .B | 2*16G FC Port Mezzanine Card
2.查看iBMC上Mezz卡状态也正常:
3.重启系统后依然不能解决问题。
4.有一个正常的刀片服务器,查看对应的网卡状态如下图所示:
故需要找找正常刀片和问题刀片的差异。
5.经对比硬件配置发现正常刀片配置了4个CPU:
但是异常的所有刀片都只有2个CPU:
6.对于全宽刀片CH242 V3服务器可以装4个Mezz卡,但对于E9000刀片服务器的Mezz卡连接器,不同槽位的Mezz卡连接器跟不同的CPU相连,如产品文档所述:
如上所述,对于全宽刀片CH242 V3服务器,Mezz1和Mezz2跟CP2相连,Mezz3跟CPU3相连而Mezz4跟CPU4相连,由于当前缺少CPU3和CPU4,导致Mezz3和Mezz4无法被识别。