200910.22
今天接个一个差事,客户的raid 5出现问题了。本人马上就赶到现场,就是raid 5 no array提示,本人一看就明白了,本人询问了客户之前操作过什么,他说就是把硬盘托架拔下来过,后来本人马上把2u的服务器搬下机柜,然后打开机器的面板,发现客户在拔硬盘的时候把sata的电源线接口拔下来了,因为客户并不知道硬盘是冷的,后来接上3个硬盘的电源接口,重新上架。在post自检的时候就可以看见raid卡的自检信息了,三块硬盘都能识别到,但是问题出现了,阵列post自检的出现状态为损坏,有一块硬盘free掉了,系统能进入windows 2003操作系统的信息,但是启动不到一半居然蓝屏掉了,又重启重启。重新插拔了一下内存还是老样子重启蓝屏,后来进主板的bios里面默认了一下出厂值,因为是板载的raid,

    在boot选项中第一个启动为raid 5 volume,hard drivers选项中优先级为最高,还是老样子,后来换内存换dimm槽位还是经常重启,后来进raid bios里面居然没有强制上线的选项,后来打了800华硕的电话他们商量了一下,说要在系统下做,要装一个软件,可是我现在系统都不能进入,就谈不上重建或强制上线了。后来想了想用安全模式能否进入系统f8就快要进入系统的瞬间又重启了,经常重启。后来把sata线每根都换了,还是不行。想到的方法全部用上了,后来居然用windows pe,插上usb-floppy和软盘驱动,f6加载驱动还是不行,说找不到驱动程序。现在实在没招了,我询问了客户,说里面有什么重要的数据吗?客户说有很重要的数据,后来居然有一个人说里面没什么重要数据,本人说你确定,后来说了确实没有什么数据,那事情好办了,后来就重新delete阵列,重新做了raid,后来询问了客户还是要做raid 5吗?他想了想说你做个raid 1加hotspare,后来根据客户的需求两个硬盘作了raid 1另一个做了热备。

    其实有一个疑问,raid 5有一块出现问题是没关系的,系统能启动,但是为什么系统启动一半就重启。难到上面的两块的数据不一致了,还是基偶校验有问题。数据错乱了,其实这些问题是最常见的,如果假设这次客户有很重要的数据在里面,那只有付出昂贵的代价到数据回复公司回复数据,回复的数据还不知道能否达到多少百分比。所以建议如果raid出现问题,最好的办法是赶紧备份数据。不要到了数据over了,才想到。所以数据的备份其实很重要的。