1、读取文件流。
2、识别可能包含要查找的内容的结构。
3、世界杯塞内加尔vs日本 正式版在第一个结构中,找到指定要查找的下一节的位置的偏移值。
4、在流中转到该节。
5、重复前面两个步骤,直到找到所需的内容。
6、读取并分析内容。
什么是二进制文件格式?
二进制文件格式 是主要包含二进制数据的任何文件格式。这包括编译的程序、图像、媒体和多数压缩文件,以及可能包含文本信息但存储为二进制数据的文件。Microsoft Office 产品使用的二进制文件格式就属于后一种情况。非二进制格式可能包括文本 (.txt), .html, .xml 及其派生形式、已解释脚本和源代码文件。
Microsoft Office 二进制文件格式的所有文件数据存在于一个或多个流中。每个流均包含用于存储元数据(如用户和系统信息、文件属性、格式信息、文本内容和媒体内容)的数据结构。这些数据结构表示为主机程序通过其用户界面解释和呈现的多组十六进制数字。
同时,流中的数据结构的组织方式各有不同。最常见的数据单元是记录。记录通常包含一些字段和标记形式的文件元数据。这包括一个或多个指示其他相关记录或其他数据的位置的偏移值。文本存储为表示 ANSI 或 Unicode 字符的数值。图像可存储为外部文件的指针,或存储为其自己的二进制文件格式的嵌入图像,如文件中的 .gif, .jpeg 或 .png。较活跃的内容(如 PowerPoint 幻灯片切换)使用阐释时所需的信息(如切换属性)进行标记,然后由主机程序呈现。