vsan数据恢复环境:
一组4台服务器搭建vsan集群;
每台服务器配置有2组分别由6块硬盘组成的磁盘阵列,上层是虚拟机文件。
vsan故障:
在运行过程中,某一个节点的一块硬盘离线,vsan安全机制启动,开始重构&迁移数据。在数据迁移过程中机房意外断电,数据重构失败,服务器重启,该节点的另一组磁盘阵列中的2块磁盘由于异常断电引发故障离线,从而让整个分布式存储瘫痪,上层所有虚拟机无法访问。
vsan数据恢复过程:
1、把+vsan集群所有节点上的硬盘以只读方式做镜像备份,备份完成后将硬盘按照原样还原到原始环境,后续的数据恢复操作都基于镜像文件进行,避免对数据造成二次破坏。
2、基于镜像文件分析底层数据,分析上层虚拟机所在磁盘位置的数据分布信息。使用北亚自研的针对vsan架构下的虚拟化数据恢复辅助程序验证数据分布信息的准确性。
3、再次分析每个节点上的两个磁盘阵列,搞清楚每个磁盘阵列内部的硬盘对应关系。
4、在每块硬盘上获取磁盘的UUID和所在磁盘阵列的UUID。
5、根据每个磁盘阵列中的容量盘的组件信息中记录的组件的MAP位置提取组件位图。
6、根据组件位图提取组件数据和缓存数据。
7、根据组件的描述信息获取组件所属对象及组件顺序并合并组件为对象。
8、根据对象提取数据。提取出所有数据后经服务器数据恢复工程师验证无异常,联系用户亲自进行验证,确认所有数据完整可用,本次数据恢复任务完成。