该主板为双CPU服务器主板,采用LGA2011Broadwell系列芯片组。
故障现象为:进系统时不断的重启,实测进CMOS画面多久也不会重启,插上U盘进入PE测试,进度条刚出来马上就重启了,依此不断循环。
首先先刷了BIOS和BMC BIOS,故障不变。按以前的经验,有自动重启更换PCH的25M晶振后修复的案例,马上更换25M晶振后测试还是一样的现象。
万用表示测量内存、PCH和CPU供电都正常,有点迷糊了;只好用示波器测一下CPU的几组供电,看波形都是正常的;测内存供电波形正常,再测另一组内存供电波形不正常(如图1所示)。
图1
断电卸下主板检查外观似乎没有看到问题,怀疑可能是U15这个驱动IC坏了。正准备用热风枪取下U15的时候,看到旁边的C145瞬间就歪了(如图2所示),仔细观察,原来C145有一边已经坏了。更换相同规格的C145后通电测试波形如图3所示,进PE和系统测试,一切正常。
小结:这个板有4组内存供电,一组供给4个内存槽,每组分2相供电,共16个内存槽。看电路图,C145的作用为自举升压电容,芯片输出的5V电压与内存核心电压叠加后驱动MOS管持续输出1.2V的内存工作电压。在CMOS设置中主板不会自动重启,个人分析为内存工作时的电流较小,所以不会触发保护。当C145这个电容损坏后,在进入系统时工作电流增大,内存的核心供电驱动IC得到不到升压或者升压不够从而导致电流不稳定,启动保护程序,故循环自动重启。
图3
湖南 郑鹏