周五晚上,问了一下lj她的html到xhtml的转化是怎么变得,当时她说是通过jaxp,在我印象中jaxp就是用来解析、创建xml,但是为什么要用这种方式呢?通过比较,个人觉得还是dom4j比较好用。
下面分别以两种方式进行xml文件的读取,主要分为dom、SAX两种方式,那么两种方式有什么区别呢?
看了很多网页总结两者之间区别,各有利弊:
【DOM和SAX区别】
DOM:读取整个文件并将该文件存储在一个树结构中,而这样可能是低效的、缓慢的,并且很消耗资源:
SAX:是一个基于事件的 API,适用于处理数据流,即随着数据的流动而依次处理数据。
DOM:使用简单
SAX:
(1)不允许对XML文件随机存取,如:当前解析到第3个Element,此时程序无法得到第5个Element的信息,因为还没有解析到第5个Element;同样也无法得到第1个Element的信息,因为已经丢失了。当然可以通过声明变量保存解析过的数据,但这如同手动在内存中构造了某种数据结构,一般都是树型结构,这相当麻烦且没有必要,因为DOM恰恰提供了这样一个内存中的模型。
(2)SAX模型中元素之间的横向移动困难:SAX提供的是层次型的解析,便利所有第1个Element的子节点(一直到叶子节点)后,才可能开始解析下一个兄弟Element。而且很难知道某一时刻,解析到了哪个层次节点了。DOM则可以很好的解决这个问题,可以方便的找到任何兄弟节点。
(3)SAX是解析一个节点后回调一个方法,把该节点相关信息传送个调用者,然后丢弃这些信息,继续解析下一个节点。正是这样一个机制,使得SAX占用内存很少,它不会预存储整个XML文档,也不会在解析后保存任何解析结果。而DOM则正好相反,把整个XML加载进内存中,即使是延迟加载策略,也会浪费额外的性能为代价。所以当XML非常庞大的时候,还是需要首选SAX。
没有绝对的哪个好那个坏,只能说在某种情况下哪个更适合一些。
===========================
下面就以示例比较jaxp和dom4j:
【xml文件如下】
<?xml version="1.0" encoding="UTF-8"?>
<elements>
</elements>
完成功能:读取xml中内容,以及标题内容。
=============================
【示例对比如下】