1、一台X3850X6服务器,正常运行中出现Single-bit ECC errors were detectd during the previous boot of the RAID controller. The DIMM on the controller needs replacement .please contact technical support to resolve this issue. press "x"......... to continue。
2、当出现这个报错提示我们RAID控制器的ECC错误,控制器DIMM需要修复。很明显是阵列卡的缓存坏了。
3、解决办法是重新插拔缓存或者直接更换掉,M5210阵列卡编码是46C9111,对应的缓存模块有44W3393(有电池接口)和47C8657(无电池接口),互相通用。
4、更换后缓存后,如果缓存没有插到位,没有和RAID卡接口完全契合或者缓存卡是坏的,则会出现BAD,missnig or unsupported RAID controlleer .... ,按D进入降级IMR模式,按任意键进去安全模式。确定缓存固定到位后,正常是会提示我们按C 再按Y 再按Y保存 导入信息的,进去后查阵列状态正常整个更换过程结束。
5、总结:a、报ECC DIMM这些就是缓存坏了,如果不是单独缓存卡那就是卡坏了,所有服务器适用。b、如果缓存或者卡没有插到位也会报错,只是跟之前的报错不一样了,需要我们仔细甄别。
6、日常工作手记,希望能帮助到你,如果搞不定请私信我。