章节目录
故障描述
环境描述:虚拟平台ESXi6.5,后端采用Mega LSI芯片RAID卡,4块3TB磁盘组建RAID5
故障现象:ESXi识别到分区,但无法加载,查看为RAW分区。
故障历史过程:
该平台之前采用3块3TB磁盘组建RAID5,后来扩容了一块磁盘;变成4块磁盘RAID5。
1、主板故障,在更换主板时,更换了硬盘位置。此时系统仍可以正常使用;
2、又更换了一次磁盘位置。此时出现掉盘,并且RAID信息也丢失。
3、用跳过初始化的方式新建RAID。此时出现ESXi识别到分区,但无法加载,用普通数据恢复软件查看为RAW分区的故障现象。
数据恢复思路
告知用户,不要对故障环境做任何动作,防止更严重的二次数据破坏,并梳理恢复步骤如下:
- 所有磁盘都能认到,不存在硬件故障。磁盘故障会影响数据恢复,但并不致命。
- 因用户新建过RAID,所以要确认磁盘是否被RAID初始化清零。虽然用户说跳过了初始化,但这一步仍要确认,磁盘未被清零是继续RAID恢复的前提。
- RAID的磁盘顺序已经混乱,必做分析出正确的磁盘顺序,并在数据恢复软件中模拟重组RAID。RAID盘序正确是继续VMFS文件系统恢复的前提。
- 如果分区未被破坏,可以直接恢复数据;如果分区被破坏,则需要裸磁盘扫描恢复数据。
- 恢复数据,启动业务。
数据恢复过程
- 搭建数据恢复环境。把磁盘从RAID卡上拨出,插入到安装Windows2008的系统主板磁盘接口上,启动Windows系统。
- 检查磁盘底层数据受损情况。用WinHex查看了4块磁盘扇区,发现有数据;并计算了4块盘的Xor校验,发现取样的几处都是对的,说明底层数据完整。(以下示例图)
- 还原RAID盘序。RAID盘序有3种办法获得:
- 通过还原磁盘移动过程,反推出最初正确的RAID盘序。需要管理员有原始记录。
- 根据文件系统特性,和扇区分析,得出正确的RAID盘序。过程复杂,需要专业人员分析。
- 用专业恢复软件的智能分析功能,可自动分析出正确的RAID参数和盘序。专业软件,使用及授权请咨询数据修复工作室。
- 本案例的情况比较特殊,客户重新创建过RAID,导致软件在分析时受了干拢,所以本次是人工分析磁盘扇区,结合VMFS结构,得出正确的盘序。专业工程师操作,过程复杂,略去不表。
- 重组RAID。
在RAID恢复向导中,配置正确的RAID参数后,退可用软件自动显示出分区和目录结构:
特别注意
VMFS文件系统是封闭的,逆向底层数据结构难度大,而虚拟平台通常是生产环境,数据丢失情况少,大部分管理员在VMFS数据恢复方面的经验并不多,尝试性操作可能带来不预测的数据二次破坏。
本案例中,难点是RAID重组,因为用户新建过RAID,导致RAID重组难度为“困难级别”。
技术支持
温馨提示:如重要数据丢失,还请在行动前咨询专业工程师建议,以免数据遭到二次破坏。
直接技术支持:shop396558956.taobao.com