-4006-505-646

 

EVA 4400存储数据恢复案例


今天小编分享的案例为:整个EVA存储结构是由一台EVA4400控制器、EVA扩展柜及若干FC磁盘组成。由于磁盘故障导致存储中LUN不可用,致使上层应用无法正常使用。

由于EVA 4400是因为某些磁盘故障导致整个存储不可用,因此接收到磁盘以后先对所有磁盘做物理检测,检测完后发现磁盘并没有物理故障。接着使用坏道检测工具检测磁盘坏道,也并没有发现大量的坏道。

考虑到数据的安全性以及可还原性,在做数据恢复之前需要对所有源数据做备份,以确保源数据的安全。使用Winhex将所有源磁盘都备份到指定的目标空间中。


【数据恢复过程】

1、编写数据恢复程序

上述的故障分析以及解决思路最终都需要使用编程来实现。编写扫描LUN_MAP的程序Scan_Map.exe,扫描全部LUN_MAP,结合人工分析得出最精确的LUN_MAP。编写检测RAID条目的程序Chk_Raid.exe,检测所有LUN中掉线的磁盘,结合人工分析排除掉线的磁盘。编写LUN数据恢复程序LUN_Recovery.exe/frombyte,结合LUN_MAP恢复所有LUN数据。

2、恢复所有LUN数据

根据编写好的程序去实现不同的功能,最后使用LUN_Recovery.exe结合LUN_MAP恢复所有LUN的数据。然后人工核对每个LUN,确认是否和甲方工程师描述的一致。

3、恢复Oracle ASM数据

(1) ASM磁盘组修复解析

对EVA存储层恢复出来的LUN进行分析,重组ASM磁盘组,并对ASM磁盘组进行解析。

总共有13个LUN,通过分析每个LUN前端的结构数据,可以根据ASM磁盘头结构来区分哪些LUN是属于ASM磁盘组的。通过分析,总共有2套ASM磁盘组。每个磁盘组包含的LUN中分区的情况如下:

图片1.png 

通过ASM结构解析工具,对每个磁盘组进行解析和修复。可以解析出此ASM中存储的所有数据库文件。如图二所示:

图片2.png

 

(2)数据库文件解析导出

对解析出的数据库文件,分别按文件类型分组导出。对导出的文件进行初步检测。然后通过ASM解析工具恢复出所有的数据库文件。


【数据验证】

根据甲方工程师描述所有LUN的数据可以分成两大部份,一部份是VMware的虚拟机,一部分是Oracle上的ASM磁盘组数据,ASM磁盘组中存放的是Oracle的DBF数据库文件。由于我们恢复的是LUN,无法看到里面的文件,因此需要将这些LUN同过人工的核对哪些LUN是存放VMware的数据,哪些是ASM设备,然后将LUN挂载到不同的验证环境中验证恢复的数据是否完整。


1、部署VMware虚拟机的验证环境

在一台dell的服务器上安装了ESX5.5虚拟主机环境,然后通过iSCSI的方式将恢复的LUN挂载到虚拟主机上。在VMware vSphere Client 上扫描VMFS卷,但是发现客户的虚拟主机是ESX4.0的版本,可能因为版本的原因无法直接扫描到VMFS卷,于是换一种验证方式。将所有符合VMware虚拟机的LUN里面的虚拟机文件都生成出来,然后通过NFS共享的方式挂载到虚拟主机上,再将虚拟机一个一个的添加到清单。


2、验证VMFS虚拟机

通过NFS将所有虚拟机都添加到虚拟主机以后,将所有虚拟机都加电开机,发现都能启动系统。将所有虚拟机都开机进入系统,验证虚拟机里面的数据都没问题。虚拟机的所有数据都恢复成功。


3、部署Oracle数据库的验证环境

为了ASM的恢复测试和后期的数据验证工作,需要先搭建好Oracle 环境。

根据甲方工程师提供的环境信息为Linux,于是需要搭建同架构的兼容版本Oracle环境

4、验证Oracle数据库

(1)验证数据库文件结构

通过相同版本的Oracle 官方检测工具DBV对导出的数据文件进行物理结构检测,以确定文件导出完好。通过对所有数据文件的验证,确定所有文件结构正确,没有结构性损坏。

(2)挂载启动数据库

在上面数据库文件物理结构验证通过后,进行启动数据库,是数据库验证的最常用手段和步骤。

通过一些迁移数据库的手段,修改控制文件中的路径,使Oracle识别到这些数据库数据文件,然后按Oracle正常步骤启动数据库。

因为原来数据库实例是有2个,并且是使用的ASM存储。所以在创建数据库实例时,要按照原来配置和命名。

在此环境下直接启动由于参数配置和数据文件路径变动,造成启动报错。需要对其进行修复。


5、修复Oracle数据库

通过一些迁移数据库的手段,修改控制文件中的路径,来让Oracle识别到这些数据库数据文件,然后使Oracle数据库按正常步骤启动。从启动过程可以看出,整个启动过程正常进行,没有任何报错,基本说明数据库完好恢复。


【数据移交及结论】

移交VMware虚拟机文件和Oracle数据库文件:验证所有数据没有问题后,将VMware虚拟机文件和Oracle数据库文件拷贝至两块3TB的希捷硬盘中。然后再将拷贝好的数据移交给客户。客户接受数据后,将数据上传至后台,经检测观察,程序可正常运行,无问题。

由于故障发生后保存现场环境良好,没用做相关危险的操作,对后期的数据恢复有很大的帮助,在预期的时间内完成整个数据恢复,恢复的数据甲方也相当满意,本次数据恢复成功。


北京北亚数据恢复中心:4006-505-646

官方网址:www.frombyte.com


4006-505-646