服务器数据恢复环境:
某品牌POWEREDGE某型号服务器,6块SCSI硬盘组建RAID5磁盘阵列;
LINUX REDHAT操作系统,EXT3文件系统。
服务器故障&分析:
经过检测以及和用户沟通后,服务器数据恢复工程师初步推断故障RAID5开始有一块硬盘离线,但是管理员没有发现,直到另一块硬盘掉线后RAID崩溃,服务器不可用。管理员联系原厂工程师,原厂工程师建议将其中一块掉线硬盘强制上线,但同时强调此操作的风险。管理员将其中一块掉线硬盘强制上线后,发现操作系统启动异常,于是马上关掉服务器,联系我们数据恢复中心寻求帮助。
RAID5阵列2块硬盘离线导致阵列崩溃这类故障非常普遍。硬盘强制上线具有较大风险,上线错误会导致RAID控制器自动做出一些不可逆操作,再次进入操作系统后,由于文件系统不一致会导致修复,最终可能会造成全部硬盘数据不一致。本案例就是这类故障。
服务器数据恢复过程:
1、完整镜像备份故障RAID中所有硬盘,在镜像过程中发现多块没有下线的硬盘存在坏道,只是RAID没有识别出来暂时没有下线。
2、基于镜像文件分析原RAID组成结构,根据原RAID信息构建虚拟RAID环境。
3、验证RAID结构的正确性,北亚数据恢复工程师修正部分后期被破坏的结构,然后将数据导出到另一存储。
4、用新硬盘在故障服务器上搭建新RAID5磁盘阵列。
5、将数据迁移至新RAID阵列。
6、用户亲自对恢复出来的数据进行验证没有发现问题,确认本次恢复数据完整有效。