中建国际(深圳)设计顾问有限公司成立于一九九四年七月,隶属于中国建筑工程总公司,是一家拥有国家甲级设计资质的建筑设计公司,曾经设计出不少国内外知名建筑,目前年营业额超过亿元。作为公司信息化建设的重要组成部门,该公司选择了HP MSA1000磁盘阵列作为公司设计数据的存储设备。
2005年 4 月20日,管理员发现系统提示MSA1000磁盘阵列分区$MFT错误,并提示运行CHKDSK进行修复,但是管理员访问该磁盘阵列时,数据还是正常的,所以对系统提示不予理会。但是到了第二天,该磁盘阵列中2号磁盘亮红灯提示故障,于是管理员就用一块新盘替换出问题的2号磁盘,可是用新磁盘替换2号盘后,阵列运行一段时间后,该阵列便不能访问了,系统仍然提示$MFT错误,并提示运行CHKDSK进行修复。根据系统提示,管理员开始运行CHKDSK命令整理修复阵列,运行一段时间后,没有完成整理动作就自动停止,反复运行CHKDSK几次,结果都是在接近完成时就自动停止了。随后,磁盘分区就不能打开了。
作为一家国际知名的建筑设计公司,磁盘阵列中存放的工作数据重要性不言而喻,这意味着企业在行业中的信誉。如果丢失,后果将不堪设想,甚至有可能给企业带来巨大的经济损失。在对比、咨询过几家数据恢复厂商提供的资料后,中建国际选择了在国内磁盘阵列的数据恢复方面久负盛名的北京护航时代科技有限公司。
一下飞机,护航时代派出的首席数据恢复专家覃廷良就直奔中建国际的机房,投入到了紧张的修复工作中。众所周知,惠普的这个产品采用了独有的RAID ADG技术,是对RAID 5进行扩展后的一个磁盘配置方案。其最大特点是部署了2个奇偶校验集,并提供了2个硬盘的容量存储这些奇偶校验信息。这个阵列能同时允许2块硬盘出现故障,突破了以往的RAID允许在同一时刻只可以有一块硬盘发生故障的限制,很有效地提高了服务器硬盘上数据的可靠性。简单的说,RAID ADG技术在原理上解决了RAID 5在二块硬盘同时出现故障时可能给企业带来的灾难。
为什么会出现这样一个从硬件设计上来说不可能出现的问题呢?
经过对磁盘底层数据的分析,经验丰富的覃廷良发现,2号盘和7号盘大约前15GB冗余信息所在的位置一样,不符合RAID ADG数据组合规律,在每块盘大约15GB以后,数据组合方式才符合RAID ADG。很有可能是管理员在因为2号盘故障换上新盘后,系统把2号盘当成7号盘,用其余的磁盘来Rebuild,造成了数据混乱,同时又执行CHKDSK命令整理修复阵列,导致目录结构错乱,几方面因素综合在一起,产生了这个原本可以通过物理冗余解决的问题。
找到了问题的根源,离最后成功也就不远了。覃廷良开始采用由护航时代独立开发出的磁盘数据修复工具——“护航舰”对磁盘数据进行重组,并对磁盘的错乱目录结构进行恢复。15个小时的紧张工作过去了,丢失的200 多GB的设计图片数据终于找到了,并且全部正确恢复,客户翘起了大拇指。
中建国际的信誉得到了维护,护航时代参加此次修复工作的技术工程师也长长出了口气,护航时代也再一次通过客户满意的称赞证明了自己在国内磁盘阵列数据恢复领域无可质疑的“龙头”地位。(新闻稿 上智传播提供 2005-09-20)