-4006-505-646

服务器数据恢复环境&故障:

10个磁盘柜,每个磁盘柜配24块硬盘。9个磁盘柜用于存储数据,1个磁盘柜用于存储元数据。

元数据存储中24块硬盘,组建了9组RAID1阵列+1组RAID10阵列,4个全局热备硬盘。

数据存储中,组建了36组6硬RAID5,36组RAID5阵列划分为2个存储系统。其中1个存储系统中的一组RAID5中有2块硬盘先后出现故障离线,RAID5阵列不可用,存储系统崩溃。

存储及文件系统架构:

01副本.jpg

注:Meta_LUN(元数据卷)    Data_LUN(用户数据卷)


服务器数据恢复过程:

1、将故障RAID5中的6块盘编号标记后从磁盘柜中取出。经过硬件工程师检测,所有磁盘都可以正常读取。以只读方式对6块硬盘进行扇区级全盘镜像。对磁盘柜中没有出现故障的RAID阵列进行存储层面的备份。

备份示意图:

02副本.jpg

在镜像过程中发现故障RAID5阵列中的1块故障离线硬盘存在大量的坏道区域,无法继续备份。在用户方的授权下,将故障盘进行开盘更换固件并使用专业工具进行修复,修复完成后该硬盘可以继续备份,但坏道仍然存在。

部分镜像文件:

03副本.jpg

2、基于镜像文件对故障RAID5阵列所有磁盘中的底层数据进行分析,获取到重组RAID需要的相关信息,利用获取到的RAID信息虚拟重组RAID阵列,并将该RAID阵列中的LUN恢复成镜像文件。在分析过程中发现,存在大量坏道的硬盘为后离线的硬盘。

3、登陆昆腾存储的管理界面,读取StorNext文件系统中与卷相关的信息,

04副本.jpg

4、分析StorNext文件系统中的Meta卷和Data卷。每一个完整的Data卷都是由多组RAID中的LUN组成的,通过分析这些LUN获取到LUN之间组合的算法规律,虚拟重组出完整的Data卷。

05副本.jpg

5、分析Meta卷,分析Meta卷中的节点信息、目录项信息、Meta卷和Data卷之间的对应关系。针对一个Meta卷管理多个Data卷的情况,研究Meta卷到Data卷的索引算法。

文件节点:

06副本.jpg

目录块:

07副本.jpg

6、通过分析研究获取到了恢复数据所需要的全部信息,北亚企安数据恢复工程师编写程序扫描Meta卷中的节点信息和目录项信息,同时通过对目录项和节点解析获取到完整的文件系统目录结构。解析每一个节点中的指针信息,将这些信息记录在数据库中。

文件信息:

08副本.jpg

7、北亚企安数据恢复工程师编写文件提取程序读取数据库,根据解析出来的信息以及两个Data卷之间的聚合算法提取数据。

8、对提取出来的数据进行随机抽样检测,没有发现问题。将全部文件提取到本地,由用户方进行检测。经过仔细检测后,用户方认可数据恢复结果。本次数据恢复工作完成。