VMware ESX Server 3.5是VMware 公司发布的服务器版本虚拟机系统平台,它是以Linux内核为基础进行二次开发出的一个虚拟机系统,它可以安装在一台主机上,在这台主机上可以安装多个独立的操作系统。在一次数据恢复案例中,我们碰到了这样一个案例:

 

软硬件环境:

VMware ESX Server 3.5安装在一台Dell服务器上,服务器上是由4块盘组成的Raid5,在Raid5上划分出一个大分区,分区文件系统类型是Vmware自己的VMFS文件系统,在这个环境下安装运行5个虚拟机,三个Windows操作系统,两个Linux操作系统。其中一个Linux操作系统下运行oracle数据,跑着非常关键的业务。

 

故障现象:

由于硬盘故障,导致VMware ESX Server 操作系统起不来,所有业务系统被迫停止,需要恢复里头的重要数据。

 

解决方案:

毫无疑问,这个Raid由于硬盘损坏,即硬盘掉线引起的Raid信息不完整,数据恢复的第一步是要重组Raid数据。由于是非Windows操作系统,Raid的分析及组合需要进行更底层的数据分析,分析完成以后才可以进行数据组合。本案例的技术难点不是Raid组合问题,达思D-Recovery For RAID软件完全可以胜任。数据恢复的难点是:我们把Raid组合到一个新的硬盘以后,怎样去恢复VMFS文件系统下的虚拟机文件,因为他是VMFS文件系统,数据恢复难度会加大。总体思路如下:

1、组合完成以后,拿组合后的硬盘挂接到台式机上,如果系统能起来,并且能访问VMFS文件系统分区,那就完事大吉,恢复算顺利完成。

2、如果上面第一步的结果是:操作系统能起来,VMFS文件系统分区却不能访问,怎么办?

3、操作系统起不来,数据恢复接下来怎么办?

面对各种假设,我们做了充分的准备,因为在天亮之前,数据要是还没恢复出来,各部门、各位领导都要骂人的。

 

技术准备:

达思对VMFS文件系统的研究已经有一段时间了,只是当时还没没有做成直接能用的产品,我就把D-Recovery软件研发人员调到现场,与数据恢复工程师一道准备,如果在RAID组合完成以后,VMFS文件系统分区,在原有环境下不能读取虚拟机文件的话,我们就安排研发人员调式程序直接从组合出来的硬盘上的VMFS分区提取出虚拟机文件。

 

处理结果:

事情总是一波三折,我们组合完数据以后,操作系统能起来了,但是VMFS文件系统分区没有能够正常访问到,于是我们把组合出来的硬盘镜像一份,交由研发人员用程序直接提取数据,一方面研究操作系统能起来而VMFS分区访问不了到底是怎么回事,三个工程师经过通宵工作,在天亮之前,操作系统VMFS分区访问正常了,研发人员提取数据的恢复也完成了。

 

本文由达思总工程师覃廷良撰写,转载请注明出处(http://www.bnuol.com 达思数据恢复技术博客)