前两天发现服务器挂了,到机房重启时发现硬盘挂载不上,虽然是开发,但是在交接工作的时候被告知了一点硬件的知识,判断出是硬盘故障。这个呵呵了,修不来只能找服务器售后来换硬盘或是维修了。
关于怎么诊断出硬盘故障的呢。首先,我已知道服务器的磁盘阵列是Raid5的,而且第二块硬盘单独闪黄灯(Raid5如果硬盘存储时,所有的硬盘同频闪灯,应该是绿色,备份的时候也是),这就是故障的位置。而且还有个地方是服务器电源按钮位置有个紫色的按钮,按下后弹出的东东(原谅我不懂硬件)上hdd亮着黄灯。hdd是什么就不用在解释了,这就很轻易的诊断了故障的大概位置。
事后也想了解各种磁盘阵列的区别,就简单总结了一下。
Raid0 :最少需要两块盘, 没用冗余数据,不做备份,任何一块磁盘损坏都无法运行。n块磁盘(同类型)的阵列理论上读写速度是单块磁盘的n倍(实际达不到),风险性也是单一n倍(实际更高),是磁盘阵列中存储性能最好的。适用于安全性不高,要求比较高性能的图形工作站或者个人站。
Raid1:至少需要两块盘,磁盘数量是2的n倍,每一块磁盘要有对应的备份盘,利用率是50%,只要有一对磁盘没有损坏就可以正常使用。n组磁盘(2n块同类型磁盘)的阵列理论上读取速度是单块磁盘的n倍(实际达不到),风险性是单一磁盘的n分之一(实际更低)。换盘后需要长时间的镜像同步,不影响外界访问,但整个系统性能下降。磁盘控制器负载比较大。适用于安全性较高,且能较快恢复数据的场合。
Raid0+1: 至少需要四块盘,磁盘数量也是2的n倍。既有数据镜像备份,也能保证较高的读写速度。成本比较大。
Raid3:至少需要3块盘(2块盘没有校验的意义)。将数据存放在n+1块盘上,有效空间是n块盘的总和,最后一块存储校验信息。数据被分割存储在n块盘上,任一数据盘出现问题,可由其他数据盘通过校正监测恢复数据(可以带伤工作),换数据盘需要重新恢复完整的校验容错信息。对阵列写入时会重写校验盘的内容,对校验盘的负载较大,读写速度相较于Raid0较慢,适用于读取多而写入少的应用环境,比如数据库和web服务器。使用容错算法和分块的大小决定了Raid3在通常情况下用于大文件且安全性要求较高的应用,比如视频编辑、硬盘播出机、大型数据库等。
Raid5:至少需要3块盘,读取速度接近Raid0,但是安全性更高。安全性上接近Raid1,但是磁盘的利用率更高。可以认为是Raid0和Raid1的一个折中方案。只允许有一块盘出错,可以通过另外多块盘来计算出故障盘的数据,故障之后必须尽快更换。比Raid0+1的磁盘利用率高,是目前比较常用的一种方案。