ODF和OOXML的对比研究

        电子文档采用什么格式存储是个大问题,存储效率如何,关系到方方面面。所谓“存储效率”,有两个方面要考虑:1、电子文件的尺寸(大小);2、语法分析(parse)所需要的时间(类似解码时间)。

         ODFOOXML都是电子文档存储的格式标准。两者的存储效率如何?是否能够做个客观的比较?比如,指定某个“电子文档”,分别将其按照ODF格式、OOXML格式存放起来,看看哪个“个头”大一些,同时,选用某种指定的“语法解析器”(所谓“Parser”),再对它们分别“解释”一下,看看谁需要的时间短一些?这一切,都牵涉到到计算机对它们的“执行效率”。把话说明白了,对于处理某个电子文档,究竟哪种“文档存储标准”更好(经济)一些?ODFOOXML能不能比试一下?

         20069月,在OpenOffice.org世界大会上,发表了一份研究报告(by Rob Weir),颇有意思。报告题目是“Comparing ODF and OOXML”,研究方式如下:在某个电子文档库(具体地说,就是Ecma TC45文档库)里面,任意选取176个“工作文档”(都是DOC文档,当作我们的“工作对象”),分别按照ODFOOXML存储起来,比比它们的“个头”大小,再指定某个语法解释器,分别处理一下它们,看看谁的“解释”所需要的时间短一些。当然,这都是“在平均意义上”进行的研究。研究目的要明确,不然就没有意思了。

        大家知道,ZIP是一种十分通用的文档压缩格式(工具),至今已经存在18年了。这项研究发现,(在平均意义上)

                                 ODF文件大小/DOC文件大小=0.38   (前者经过压缩之后)

                                OOXML文件大小/DOC文件大小=0.50 (前者经过压缩之后)

         由此可见,对于同一DOC格式的电子文档,其相应的ODF 文档的大小(平均)要比OOXML文档的大小要“小一些”,大约只有OOXML文档的72%。十分明显,ODF要比OOXML的存储效率要高一些。

         该项研究发现,ODFOOXML的解释(解码)“效率”(所需要的时间)满足以下公式(在平均意义上):

                                   OOXML解释时间=3.5乘以ODF解释时间,

很明显,解释OOXML所需要的时间是ODF 3.5倍。

         根据以上研究,我们可以看出,全球几亿台计算机大规模地处理电子文档,使用不同的电子文档“国际标准”所造成的存储空间和计算时间的浪费必定是十分巨大的。几十年之后,我们的聪明后代一定会发现这一点,他们一定会感到惊异和不解,为什么“老爷爷”微软公司要搞这种东西。那时,他们自然懂得,“政治(含经济)决策”有时是反科学的(比如,“麻省现象”)。我们提倡“科学发展观”,就一定要反对出现“麻省现象”。

         (注:所谓“麻省现象”是指美国麻省政府官员决定建立“双标”(即ODFOOXML)计算环境,有意让ODFOOXML相互“打架”,看谁最后“胜出”。浪费资源,无所谓。)

 
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值