破损Excel文档的碎片重组修复
Excel文件的重要性是毋庸置疑的,在日常使用的过程中由于各种原因,比如病毒感染、硬盘损坏或者最常见的文件被删除或者格式化后,客户通常去网上下载那些厉害的不要不要的恢复软件恢复出来的文件,很多时候是不能正常打开或者打开乱码。究其原因、跟Excel文件自身独特的数据结构特点是密不可分的。
当用户新建立一个或者复制一个Excel文件时,操作系统会将这个新文件存放在硬盘的一段连续存储空间内,而Excel文件在随后的编辑过程中其存储位置会不断发生变化,且呈现不连续存放即离散存储的特征,这些离散的数据就是碎片,而这是由OFFICE软件设计本身的机理决定的、由windows设计者为文件分配存储单元的分配策略所决定的。
当前绝大多数的数据恢复软件无不采用MFT记录恢复方式也就是特征值恢复方式恢复算法。简单的说、恢复软件通过扫描NTFS文件系统里的MFT元文件上的MFT记录、这条记录保存了文件的名称、大小、建立等各项基础信息以及文件在硬盘上的存储位置,依据文件头部及尾部的特征值进行扫描,软件扫描硬盘后定位并将头、尾数据块之间的所有数据提取合成一个原始Excel文件,也就是得到的恢复出的数据;这个新Excel文件很可能是残损的、不完整的,残缺不厉害的修复即可,缺损厉害的甚至需要再次恢复。中心在长期潜心研究Excel文件的数据结构后,针对破损的Excel碎片文件进行关键数据结构的重组,可以最大限度的从破损严重的Excel文件中提取出最关键的文本信息。