时间不算太短也不是很长,大概一个月左右吧,向华为申请一台有12块2T的SATA盘的服务器,其实之前早就在备件中选了一台放在了测试区的一个机柜中,但因为别的原因拖着一直没有安装所使用的OS。准确的说,做了RAID0的系统盘里存在一个不知什么时候装好的 Windows Server 2008 Standard,具体用来做啥的不知道,为以防万一没有给 CentOS,所以今天就在4台备件中又换了一台,里面装的是 Suse Linux。。。。。。接着换,哦,忘了,里面有一台只有2块硬盘,放弃。接着换,最后一台放到机柜中,插上电源线和串口线,启动服务器,服务器上12块硬盘的运行指示灯都正常,从外面根本看不出任何问题。从显示器中硬件自检到检查硬盘,输出硬盘列表信息(其实没有输出硬盘列表,起初并没有引起注意),到最后的提示没有找到可引导启动的加载程序的报错信息。

从主板BIOS中查看BMC并修改登录BMC的 root的密码后登录BMC,监控页面上显示12块硬盘一块都没有亮,全部灰色,但还是没有引起注意,然后从“远程控制”选项功能的虚拟光驱把 CentOS 6.3的镜像文件插了进去,连接上并CD-DVD引导。从语言选择到设置root密码的过程都很正常,直到自定义分区点击“下一步”,就弹出窗“No disks found”报错,试了3次情况还是一样。

205025857.png


开始以为硬盘有问题,但这个猜测马上被推翻,硬盘运行指示灯是正常的。把第1块和第2块盘调换了一下,还是一样;把数据盘放在系统盘的位置同样如此。我想,是不是因为系统版本比较高导致硬盘不支持此OS。接着换用CentOS 5.8安装,没想到还是报这个错。对了,之前华为的内部客户因为有云计算的需求让我在这个型号的机器上安装CentOS 6.3也没发现啥问题,难道真是服务器的问题。这时无意中看到监控界面的硬盘都是灰色的才知道根本不是OS的问题。

210529838.jpg

通过内置的RAID配置程序查看RAID信息时,也没有看到任何硬盘的信息,这更加说明是服务器有问题。在网上查了下资料,有说更改硬盘模式的,硬盘的3种模式:RAID Mode、SATA Mode和 AHCI Mode,有说修改硬盘接口的,把SCSI改为IDE的,这种纯属扯淡,还有说在安装OS时,按一下“Tab”键,出现命令行,在该行末添加pci=nomsi nolapic noapic命令,按enter键,进入安装界面,不知道靠谱不,没试。既然不是OS的原因,那应该是RAID卡的原因了,暂时先放下,先把装有 Windows Server 2008的服务器换过来装上 CentOS。换上这台服务器后重新配置RAID0,装CentOS,过程果然是比较顺利,不到50分钟就基本上系统给装上了,中间虽出了点小问题,但没耽搁太多时间就解决了,单纯装rpm包用时不到20分钟,只把必要的包装上了,总共好像860多个包,之后重启,简单的配置了一下就进入系统可以正常使用了。

平时的工作中一定要养成善于观察的好习惯,很多时候这对我们系统运维人员在做基本的操作时出现这种低级的错误有很大的帮助,不仅能找到报错原因为解决问题提供重要的信息,更重要的是能够避免浪费很多时间,提高工作效率。这对我们在职场上也会有很大的帮助。