杂记2

RAID 5

在以上各个级别中,RAID 5的优点最为突出,对于大型重要应用环境而言,可作为首选。不过对于大多数追求速度的DIY爱好者而言,采用两块IDE硬盘组成的RAID 0磁盘阵列更为合适。

  现在我们以HP ML370 G3服务器为例,我采用的是HP642磁盘阵列卡。安装方法如下:

  首先我们将启动设为光驱启动,放入HP服务器自带的工具盘(其中包括了所有的驱动,注意:不同型号的服务器磁盘阵列的方法安装不同,有些磁盘阵列卡需要先将其自带光盘里的RAID卡驱动复制到软盘里面再安装,这里只是举例)。

  装上HP642阵列卡,重启的时候会发现自检到一快RAID卡,然后我们按下F8,这就到了阵列卡模式设置菜单。我只安装了两块SCSI 36.4G的HP原装硬盘,我用的模式是RAID1(因为我所装的服务器要两把这两块硬盘做镜像,这些模式我不讲了,上面都有)。选择创建主分区,再选择RAID1模式。硬盘阵列的第一步就算做好了,接下来计算机会自动重启,这时会出现找不到SCSI引导驱动,这一点不要管,因为我们是把硬盘接在了RAID卡上,所以SCSI找不到硬盘。这是正常的。这时的计算机是从光驱启动的。

  HP的启动光盘是傻瓜式安装,第一步选择你所要安装的系统,我选的是WIN2000高级服务器版,接下来一步是要你选择你的分区大小了。我们选择NTFS格式,将主分区分为8G,剩下的我们暂时不要管。接着系统会提示你插入WIN2000的安装盘,插入安装盘后。系统会自动复制文件,接着又会重启,下面是WIN2000的安装了,这不用我讲了吧。安装完WIN2000系统后,点击开始--程序---计算机管理---磁盘管理,将剩下的空间再重新分区。所有的过程就算做完了。

http://www.ibmsos.cn

是X系列的服务器吧,PS就是Power Supply的缩写,power supplies has failed的意思就是电源供电失败.

这种原因一般是双电源供电的服务器出现了仅有单路供电的问题.

你可以查看服务器背面的电源模块,应该有一个电源模块的LED灯已经不亮了.

仔细检查是不是电源线出现松动.

如果没有松动,那就是供电的PDU出现问题或者电源模块故障.

一般电源模块故障占很大比例.可以保修至MA公司要求现场检查.

单点供电存在风险,请不要轻视.

继续追问: 是 X3850的服务器。一共2台都出现这个问题了,其中一个就是背后的电源模块的LED灯不亮了。后来关机拔电源线,重新连接安上这个就好了。另外一台的PS灯还是亮着。不解。
http://wenku.baidu.com/view/0c2582f0f90f76c661371af6.html

EVENT LOG指示灯报警

有台IBM服务器前面的光通路面板开始亮起了小黄灯,推出这个小盒子一看,是EVENT LOG指示灯报警。一时不知道是什么原因,可能是日志错误,要进Configuration 去调一下,于是打800电话,硬件工程师听了我的问题后,说应该是日志文件满了,应清空一下,开机启动时,看到提示按F1进Configuration中把两个日志文件都清一下,我问怎么会满呢?他说只能存512条日志文件,多了就因覆盖不了前面的日志文件而报警,按他的方法在F1进入的 Configuration/Setup Utility中,选择POST Error Log选项后,直接回车选择Clear error logs清除所有的自检日志,同样选择System Error Log,直接回车选择Clear error logs清除所有的系统日志,一切OK。

PS2指示灯报警

IBM的解释是这个PS2不是PS2接口,而是服务器电源

DASD指示灯报警

7月21日下午检查机房设备时,发现一台IBM x3650服务器0号硬盘黄灯闪烁,前面板“!”红色警示灯亮,操作系统运行正常。打开“Light Path“面板,发现”DASD“灯亮,上网搜索了一下得知DASD(Direct Access Storage Device)灯亮是硬盘背板故障。这台服务器才运行一年多时间啊,不会这么快就坏吧。赶紧拨打IBM 800报修电话,描述完故障,客服人员做好记录后说呆会有工程师回电。可1个多小时过去了还没接到回电(当时心里不是很爽),于是又拨通了IBM报修热线,这回接电话的是另外一位工程师,了解故障情况后,答复:黄灯闪烁是硬盘在同步数据,同步完成会熄灭,DASD灯亮需作测试报告以进一步确定故障原因,有可能要对机器作微码升级,让我先做好数据备份,并将测试步骤以及所需测试软件发到我的邮箱。
  下午快下班的时候,0号硬盘黄色故障灯果然熄灭恢复正常,但DASD故障灯仍亮,这样看来,0号硬盘本身应该没什么问题,故障可能真的出在硬盘背板上。不管怎么样,先将数据备份至另外一台服务器上。备完数据,按照IBM邮件里的处理步骤,进行DSA动态系统诊断,并将生成的诊断报告回复给IBM。
  7月23日下午3:30,BE准时到现场。我询问到底是什么故障?答复升级微码后应该能解决问题,至于要不要更换硬盘背板还要看升级后的情况。接下去就是一系列的微码升级工作,包括主板BIOS、RAID卡等等。升级完成后,DASD故障灯果然熄灭,服务器看似恢复正常了。由于此前0号硬盘有报警,于是按Ctrl+A进入Array Controller对0号硬盘进行扫描检测,结果一切正常,排除了硬盘故障。硬盘背板是否正常,现在也不能下定论,工程师让我再观察几天,暂时不换备件。
    下午2点,BE带着备件准时到场重新接回线缆、盖上机盖、开机、进入系统,一切常,                
              故障排除了,也留下许多疑问。如果确实是硬盘背板问题,为什么微码升级过后就恢复正常了?如果背板是好的只是单纯微码升级问题,为什么故障在机器运行一年多后才出现?这些疑问BE没有当场给我答复,让人纳闷。希望有同样经历的朋友互相交流!

 

ps   指示灯:当此指示灯发亮时,表明电源2 出现故障。

temp 指示灯:当此指示灯发亮时,表明系统温度超出阈值级别。

fan:当此指示灯点亮时,表明散热风扇或电源风扇出现故障或运行太慢。风扇发生故障还会导致over temp 指示灯发亮。

link指示灯:当此指示灯发亮时,网卡出现故障。

vrm 指示灯:当此指示灯发亮时,表明微处理器托盘上的某个vrm 出现故障。

cpu 指示灯:当此指示灯发亮时,表明某个微处理器出现故障。

pci 指示灯:当此指示灯发亮时,表明某个pci 总线发生错误。

mem 指示灯:当此指示灯发亮时,表明发生内存错误。

dasd 指示灯:当此指示灯发亮时,表明某个热插拔硬盘驱动器出现故障。

nmi 指示灯:当此指示灯发亮时,表明出现一个不可屏蔽中断(nmi)。

sp 指示灯:当此指示灯发亮时,表明服务处理器遇到错误。

brd 指示灯:当此指示灯发亮时,表明某个连接的i/o 扩展单元出现故障。

log 指示灯:当此指示灯发亮时,表明您应该查看事件日志或remotesupervisor。

cnfg指示灯:当此指示灯发亮时,表明BIOS配置错误

raid 指示灯:当此指示灯发亮时,表明阵列卡故障。

over spec 指示灯:当此指示灯发亮时,表明对电源的需求超过了指定的电源供应。

remind 按钮:按下此按钮可重新设置操作员信息面板上的系统错误指示灯并将服务器置于提醒方式。在提醒方式下,故障并没有清除但系统错误指示灯会闪烁(每2 秒闪烁一次)而不是持续发亮;如果出现另一个系统错误,则系统错误指示灯将会持续发亮。 

--------------------------------

EVENT LOG指示灯报警

有台IBM服务器前面的光通路面板开始亮起了小黄灯,推出这个小盒子一看,是EVENT LOG指示灯报警。一时不知道是什么原因,可能是日志错误,要进Configuration 去调一下,于是打800电话,硬件工程师听了我的问题后,说应该是日志文件满了,应清空一下,开机启动时,看到提示按F1进Configuration中把两个日志文件都清一下,我问怎么会满呢?他说只能存512条日志文件,多了就因覆盖不了前面的日志文件而报警,按他的方法在F1进入的 Configuration/Setup Utility中,选择POST Error Log选项后,直接回车选择Clear error logs清除所有的自检日志,同样选择System Error Log,直接回车选择Clear error logs清除所有的系统日志,一切OK。

PS2指示灯报警

IBM的解释是这个PS2不是PS2接口,而是服务器电源

DASD指示灯报警

7月21日下午检查机房设备时,发现一台IBM x3650服务器0号硬盘黄灯闪烁,前面板“!”红色警示灯亮,操作系统运行正常。打开“Light Path“面板,发现”DASD“灯亮,上网搜索了一下得知DASD(Direct Access Storage Device)灯亮是硬盘背板故障。这台服务器才运行一年多时间啊,不会这么快就坏吧。赶紧拨打IBM 800报修电话,描述完故障,客服人员做好记录后说呆会有工程师回电。可1个多小时过去了还没接到回电(当时心里不是很爽),于是又拨通了IBM报修热线,这回接电话的是另外一位工程师,了解故障情况后,答复:黄灯闪烁是硬盘在同步数据,同步完成会熄灭,DASD灯亮需作测试报告以进一步确定故障原因,有可能要对机器作微码升级,让我先做好数据备份,并将测试步骤以及所需测试软件发到我的邮箱。
  下午快下班的时候,0号硬盘黄色故障灯果然熄灭恢复正常,但DASD故障灯仍亮,这样看来,0号硬盘本身应该没什么问题,故障可能真的出在硬盘背板上。不管怎么样,先将数据备份至另外一台服务器上。备完数据,按照IBM邮件里的处理步骤,进行DSA动态系统诊断,并将生成的诊断报告回复给IBM。
  7月23日下午3:30,BE准时到现场。我询问到底是什么故障?答复升级微码后应该能解决问题,至于要不要更换硬盘背板还要看升级后的情况。接下去就是一系列的微码升级工作,包括主板BIOS、RAID卡等等。升级完成后,DASD故障灯果然熄灭,服务器看似恢复正常了。由于此前0号硬盘有报警,于是按Ctrl+A进入Array Controller对0号硬盘进行扫描检测,结果一切正常,排除了硬盘故障。硬盘背板是否正常,现在也不能下定论,工程师让我再观察几天,暂时不换备件。
    下午2点,BE带着备件准时到场重新接回线缆、盖上机盖、开机、进入系统,一切常,                
              故障排除了,也留下许多疑问。如果确实是硬盘背板问题,为什么微码升级过后就恢复正常了?如果背板是好的只是单纯微码升级问题,为什么故障在机器运行一年多后才出现?这些疑问BE没有当场给我答复,让人纳闷。希望有同样经历的朋友互相交流!

 

ps   指示灯:当此指示灯发亮时,表明电源2 出现故障。

temp 指示灯:当此指示灯发亮时,表明系统温度超出阈值级别。

fan:当此指示灯点亮时,表明散热风扇或电源风扇出现故障或运行太慢。风扇发生故障还会导致over temp 指示灯发亮。

link指示灯:当此指示灯发亮时,网卡出现故障。

vrm 指示灯:当此指示灯发亮时,表明微处理器托盘上的某个vrm 出现故障。

cpu 指示灯:当此指示灯发亮时,表明某个微处理器出现故障。

pci 指示灯:当此指示灯发亮时,表明某个pci 总线发生错误。

mem 指示灯:当此指示灯发亮时,表明发生内存错误。

dasd 指示灯:当此指示灯发亮时,表明某个热插拔硬盘驱动器出现故障。

nmi 指示灯:当此指示灯发亮时,表明出现一个不可屏蔽中断(nmi)。

sp 指示灯:当此指示灯发亮时,表明服务处理器遇到错误。

brd 指示灯:当此指示灯发亮时,表明某个连接的i/o 扩展单元出现故障。

log 指示灯:当此指示灯发亮时,表明您应该查看事件日志或remotesupervisor。

cnfg指示灯:当此指示灯发亮时,表明BIOS配置错误

raid 指示灯:当此指示灯发亮时,表明阵列卡故障。

over spec 指示灯:当此指示灯发亮时,表明对电源的需求超过了指定的电源供应。

remind 按钮:按下此按钮可重新设置操作员信息面板上的系统错误指示灯并将服务器置于提醒方式。在提醒方式下,故障并没有清除但系统错误指示灯会闪烁(每2 秒闪烁一次)而不是持续发亮;如果出现另一个系统错误,则系统错误指示灯将会持续发亮。 


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值