一台Xserver3950 LED亮红灯,查看面板,发现MEM和LOG亮红灯。

一、收集出错日志

1.在服务器上安装BMC/IPMI芯片的驱动程序:
(1)先安装“osa_dd_ipmi_jap409a_winsrvr_32-64.exe”(安装时选“accept”,其余都选默认的即可)
(2)再安装“ibm_lib_mlayr_vap418a_winsrvr_i386.exe”(都选默认的)。
注意:
(1)安装顺序不可颠倒;(2)如果之前已经安装过,就不需要安装了。

2.在服务器上双击运行ibm_utl_dsa_211p_windows_i386.exe(运行时间可能会要5-15分钟左右);
当黑色的DOS窗口出现“DSA capture completed successfully. Press enter to continue...”表示运行成功!

3.在“C:\IBM_Support\”里会生成一个压缩包文件(...xml.gz)


附:
(1) osa_dd_ipmi_jap409a_winsrvr_32-64.exe 下载链接:
[url]https://www-304.ibm.com/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-5069608&brandind=5000008[/url]
(2) ibm_lib_mlayr_vap418a_winsrvr_i386.exe 下载链接:
[url]https://www-304.ibm.com/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-5069605&brandind=5000008[/url]
(3)ibm_utl_dsa_211p_windows_i386.exe 下载链接
[url]https://www-304.ibm.com/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-5075327&brandind=5000008[/url]

二、分析产生的xml.gz文件,定位出错部件。

1、COPY 下面两个文件到指定目录( C:\IBM_Support
IBM_Support>ibm_utl_dsa_212p_windows_i386.exe
c:\IBM_support8872I61_99T4286_20080921-154948.xml.gz

2、运行下面命令

C:\IBM_Support>ibm_utl_dsa_212p_windows_i386.exe  -v -x -i  c:\IBM_support8872I61_99T4286_20080921-154948.xml.gz
Extracting...
Executing...


IBM Dynamic System Analysis Version 2.12.17
(C) Copyright IBM Corp. 2004-2008. All Rights Reserved.

Logging console output to file C:\IBM_Support\DSA_Output_NJTRH-S-0001_20080921-1
64943.txt
Logging level set to Status.

Copying Schema...

Reading input file.
Writing HTML files to directory C:\IBM_Support\8872I61_99T4286_20080921-164943
Report: columns add to 60% for the Virtual Teams report definition (CIM class IB
MSG_VirtualNetworkingGroup)

DSA capture completed successfully.
Press enter to continue...


C:\IBM_Support>

3、 查看下面生成的文件,找查出错信息
然后在这个目录(C:\IBM_Support\8872I61_99T4286_20080921-164943)下面生成一些网页文件,打开index,可以查看。RecordID 50显示是第八根内存条出错,第八根内存对应位置可以查看打开的机箱盖。第二个内存板卡的第四根内存。
注意:按一下内存板卡的LED灯,就会显示哪个内存坏了,比较有意思。

更换内存,完成处理。开机重启,内存是8GB,处理完成。