-4006-505-646

断电虚拟机无法启动恢复案例教程



本次分享的是因意外断电,导致某台虚拟机不能正常启动,查看虚拟机的配置文件时发现此虚拟机的配置文件除了磁盘文件以外其他配置文件全部丢失。此时磁盘文件和快照文件还存在。当遇到这种情况应该如何进行正确的操作呢?
 
【初检分析及数据恢复方式】
找VMware工程师诊断后,尝试新建一个虚拟机来解决故障,但发现ESXi存储空间不足。因此就将故障虚拟机下的某个磁盘文件删除了,这时ESXi存储就有200多G的剩余空间了,而后VMware工程师就重新建了一个40G的虚拟机,并且分配了固定大小的虚拟磁盘,Windows Server 2008,数据库应用环境SQL Server 2008数据库服务器,虚拟机磁盘容量精简200G数据盘+ 160G快照数据盘。
 
在VMware vSphere Client上将挂载的RD220i存储中VMFS卷以正常方式卸载掉。然后将卷通过网线的方式连接到备份服务器上,接着使用专业的工具将整个VMFS卷以扇区的方式镜像到已准备的备份空间上。分析VMFS卷的底层数据发现,ESXi主机的突然断电导致故障虚拟机目录下的目录项出现破坏,但是这种破坏不会影响虚拟机的重要数据,只是破坏了文件的目录项而已,可以通过人工修复即可解决。而人为删除某个文件的话,则目录项对应的数据区索引会被清掉,也不会影响删除文件的实际数据。这种情况可根据删除虚拟磁盘文件中的文件系统以及虚拟磁盘中的文件类型在VMFS卷自由空间中进行碎片匹配和合并,最终也可恢复删除的虚拟磁盘文件。但是在上述的两种情况之下又新建了一台虚拟机,并且分配了虚拟磁盘。
 
经过分析发现分配的虚拟磁盘已经全部清零了,也是这个新建的虚拟机所占用的磁盘空间全部被清零。 如果新虚拟磁盘占用了删除虚拟机磁盘所释放的空间,那么此部分空间将无法恢复的。根据SQL Server数据库的结构去自由空间中找到数据库的开始位置。在数据库的结构中,数据库的第9个页会记录本数据库的数据库名。因此根据这个特征可以核对此数据库的头部页是否是正在查找的。并且数据库的每个页中都会记录数据库页编号以及文件号,所以根据这些特征编写数据库扫描程序,然后利用程序去底层扫描所有符合数据库页的数据碎片。接着将扫描出来的碎片按顺序重组成一个完整MDF文件,再通过MDF校验程序检测整个MDF文件是否完整。在整个校验过程中,只有极少量因有部分碎片没有找到外,其余数据库均校验成功。
 
实施完后,并没有将所有的数据库文件全部恢复出来,还有文件因缺失部分页导致其无法正常使用。因此需要采用备份来恢复这两个数据库文件,但是在检查完这两个文件的备份后发现全部备份因备份机制故障导致没有备份出来,之前的备份全部没有,只有最近的全部增量备份
因此可以根据缺失的页号在增量备份中查找,再将找到的页补到文件中,这样可以恢复一部分丢失的数据库页。最终补完后还是缺失部分页,无法正常使用。但是可以通过自主开发的数据库解析程序将文件中用户比较重要的几十张表成功导出,并成功导入到新建的数据库中。
 
【数据恢复结果】
在本地服务器中搭建和原始环境一样的数据库环境并安装上层宏桥应用软件。再由客户安排工程验证数据库是否完整,经过验证后,数据库恢复基本没问题。上层应用可以正常运行,数据记录也都基本没有缺失,数据库成功挂载,本次数据恢复成功。

【北京北亚数据恢复中心】

地址:北京市海淀区温泉镇中关村创客小镇16号221
电话:4006-505-646