Word 2007(以下简称W07)的文件格式不同于Word 2003(以下简称W03),W03的默认文件格式采用源自office 97时使用的二进制文件格式,而W07使用的是Microsoft Office Word XML格式,也称Word XML格式。
W07的文件格式由ZIP压缩包组成,压缩包包含了Word中的所有信息。这种格式的好处是:
-
- 减少了Word保存后的大小,因为其采用的是zip压缩。
- 更加稳定,避免传输或处理过程中可能出现的错误。
- 更加方便于对Word的变成控制。
可以将一个word文档保存为zip格式,然后解压到一个文件夹,这样你将会发现,原来的word文件被解压为几个文件夹信息和几个xml。具体可能为:_rels folder(关系部件),docProps folder(属性部件),word folder(内容部件),[Content_Types].xml(描述文件各个内容类型),datastore folder(自定义XML数据部件)等。在这些文件夹中,lists.xml保存的是列表信息,setting.xml保存的是文档设置,header.xml保存的是页眉信息,footer.xml保存的是页脚信息,footnotes.xml保存的是脚注信息,endnotes.xml保存的是尾注信息,image folder保存的是Word中的图片,comments.xml保存的是注释信息,fonttable.xml保存的是字体信息,customXML folder保存的是自定义XML项,webwetting.xml保存的是web设置项,custom.xml保存的是智能文档开发中所添加的架构和动态链接库的配置信息……
既然有这么多XML对Word进行描述和信息的保存,那么这些XML又是怎么关联起来的呢?这就需要一个关系把各个XML关联起来,也就是[Content_Types].xml来对所有的XML进行管理,然后有一个.rels.xml文件对Word中关系进行解析,具体怎么解析还需要具体进一步分析。
由上可以看出,W07是把Word分成不同的部件进行,然后通过ZIP压缩的方式对Word的内容、格式及相关的自定义设置进行保存。对Word单个整个文件采用了组件化思想,当需要修改Word的某一个属性的时候,只需要修改相应的XMl信息,就可以完成操作,而不需要对整个Word进行操作。同时,Word的各种组件,都是XML数据类型的文件,这样可以为第三方组装符合自己需要并且能被Office打开的Word提供了不少方便。
具体参考:http://www.microsoft.com/china/msdn/library/office/office/Word2007XMLFormat.mspx?mfr=true