存储数据恢复环境:
IBM某型号存储设备,一个存储机头+多个存储扩展柜;
创建多组RAID5。
存储故障:
其中一个存储扩展柜中的RAID5由15块硬盘+1块热备硬盘组成。该存储扩展柜中的一块硬盘离线,热备盘替换上线开始同步数据。在热备盘同步数据过程中,另外一块硬盘故障离线,导致数据同步失败,RAID5阵列崩溃不可用,卷无法挂载访问。管理员联系我们数据恢复中心进行数据恢复。
存储数据恢复过程:
1、服务器数据恢复工程师拿到硬盘后为每块硬盘做镜像, 所有的数据恢复操作都在镜像盘上进行, 不会对原始硬盘上的数据造成影响。
2、分析raid结构,利用北亚自主研发的工具虚拟重组出lun并提取出来。
3、重做故障raid,新创建lun映射到数据恢复服务器,将提取出来的lun文件一一对应拷贝到新创建的lun中。
4、将拷贝好lun文件的lun全部映射回原服务器,映射成功并检测无误。但是管理员验证后发现有部分目录没有恢复出来。
5、服务器数据恢复工程师经过仔细检查后发现其中一个lun的部分数据错乱,于是重新提取这个lun的数据。
6、重新提取完成这个出问题的lun的数据后,再次映射回原服务器。管理员再次对数据进行验证没有发现问题。本次数据恢复成功。
小贴士:
服务器、存储中RAID瘫痪后应该立即断电,不要做同步或强制上线操作,防止数据进一步破坏,应联系专业数据恢复人员进行恢复。
针对软件故障,在数据丢失后,应尽可能减少对存储的操作,有时候,即使是开着机,什么都不做,也可能导致灾难进一步加剧。条件允许的话,最好损坏后,对磁盘或存储卷做完整备份。
针对硬件故障,在设备无法正常工作后,应尽可能少的加电,以避免设备的进一步损坏。