【北亚数据恢复】服务器raid阵列瘫痪导致ZFS文件系统元文件损坏的数据恢复

在本次数据恢复过程中,服务器遭遇RAID5阵列瘫痪,两块硬盘故障,热备盘仅一启用。经过物理检测无故障后,进行硬盘备份和520到512字节转换。通过分析确定RAID信息,重建阵列并识别出最先掉线硬盘,修复损坏的ZFS文件系统元文件,最终成功恢复服务器数据。
摘要由CSDN通过智能技术生成

服务器数据恢复环境:


emc服务器;
raid5磁盘阵列;
两块热备盘。

故障:


服务器上有两块硬盘出现故障,但是热备盘中只有一块被成功激活,导致了raid阵列瘫痪,服务器的上层应用不可用。管理员联系北亚数据恢复中心进行数据恢复。


 
服务器数据恢复过程:


1、服务器故障检测。首先对两块掉线的硬盘进行物理故障检测,如果发现物理故障,需要对硬盘进行物理修复,然后才能继续下一步数据恢复操作。经过检测,所有硬盘(包括掉线硬盘)不存在物理故障。

 

2、备份服务器所有硬盘。在数据恢复开始前需要将所有原始硬盘进行镜像备份。服务器硬盘无物理故障可直接备份,由于源磁盘的扇区大小为520字节,因此还需要将所有备份数据做520到512字节的转换。

3、对服务器底层raid组进行数据分析。经过对raid阵列的分析,北亚数据恢复工程师发现原服务器内的两块热备盘内均为空,没有写入任何数据(由此推断:一块热备盘虽然上线,但此时raid组仍然处于缺盘状态,数据并没有开始同步。)。

4、北亚数据恢复工程师依次分析整个raid5阵列上的条带大小,磁盘顺序等基础信息,开始进行raid重组。

5、根据获取到的RAID信息,使用北亚自主开发的RAID虚拟程序将原始的RAID组虚拟出来。但由于整个RAID组中一共掉线两块盘,因此需要搞清楚这两块硬盘掉线的顺序。

 

6、仔细分析每一块硬盘中的数据,发现有一块硬盘在同一个条带上的数据和其他硬盘明显不一样,因此初步判断此硬盘可能是最先掉线的。通过北亚自主开发的RAID校验程序对这个条带做校验,最终确定最先掉线的硬盘。

7、LUN是基于RAID组的。根据上述分析获取到的信息将RAID组重组出来,然后再分析LUN在RAID组中的分配信息以及LUN分配的数据块MAP。

8、根据获取到的LUN信息,使用北亚自主开发的raid恢复程序解释LUN的数据MAP并导出LUN的所有数据。

9、解释ZFS文件系统并修复。利用ZFS文件系统解释程序对生成的LUN做文件系统解释,发现程序在解释某些文件系统元文件的时候报错。北亚数据恢复工程师立即对程序做debug调试,分析程序报错原因,同时分析ZFS文件系统是否因为版本原因导致程序不支持。经过长达7小时的分析与调试,最终发现ZFS文件系统因存储瘫痪而导致其中某些元文件损坏,从而导致ZFS文件系统解释程序无法正常解释。

10、对损坏的文件系统元文件做修复才能正常解析ZFS文件系统。通过对损坏的元文件分析,北亚数据恢复工程师发现:因当初ZFS文件正在进行IO操作的同时存储瘫痪,导致部分文件系统元文件没有更新或者损坏。北亚数据恢复工程师对这些损坏的元文件进行手工修复,保证ZFS文件系统能够正常解析。

11、对修复后的文件系统进行解析并验证最新数据。经过服务器管理员的亲自验证,确认服务器内所有数据被成功恢复。


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值