服务器数据恢复环境:
Dell某型号服务器;
6块SCSI硬盘组成raid5磁盘阵列;
操作系统为Redhat linux ;
文件系统为ext3文件系统。
服务器故障&分析:
服务器在工作过程中瘫痪,管理员检查后发现raid5阵列中两块硬盘离线,于是对其中一块硬盘进行强制上线操作,但是操作系统不能正常启动。管理员马上把服务器关机,联系到我们数据恢复中心进行数据恢复。
在我们数据恢复中心接到的服务器数据恢复案例中,raid5两块硬盘离线这种类型的故障十分常见。raid5磁盘阵列只支持一块硬盘离线时的冗余保护,如果有超过一块硬盘离线,服务器raid5阵列便会瘫痪且不会自动上线。由于一些厂家的raid控制器比较敏感,raid阵列中硬盘掉线多数情况下是由供电电源波动、控制器bug等原因造成的,所以掉线盘不一定有严重的物理故障。通过服务器数据恢复工程师的检测,发现本案例中的raid5阵列故障就是属于此列。如果raid5磁盘阵列中有超过一块硬盘离线,此时进行强制上线操作的风险很大,一旦上线出错就会让raid控制器对数据造成不可逆的损坏。当管理员进入操作系统后,因为文件系统不一致进行修复,服务器中所有硬盘数据不一致,数据恢复难度非常大。
服务器数据恢复过程:
1、服务器数据恢复工程师对服务器中所有硬盘进行完整镜像备份,在备份过程中发现多块硬盘存在坏道但并没有下线,初步判断raid没有读取到硬盘坏道。
2、完成备份后北亚服务器数据恢复工程师分析原服务器的raid组成结构,虚拟出raid环境,然后对raid结构进行畸形验证。
3、北亚服务器数据恢复工程师人工修正被破坏的raid结构,将修正后的数据导出到一台中间存储上临时存放。
4、使用完好的硬盘在服务器上搭建新的raid5磁盘阵列,将恢复出的数据迁移到新搭建的raid5阵列中。
5、检验恢复出来的数据,没有发现异常,数据成功恢复。
服务器数据恢复Tips:
raid5磁盘阵列出现多块硬盘离线,服务器瘫痪的情况下切记不要盲目进行强制上线操作。如果有足够的备用空间,可将源硬盘全部镜像,然后寻求正规专业的数据恢复机构的帮助。