关于jaxp和dom4j【sax和dom…

最新推荐文章于 2020-11-16 17:21:51 发布

huangleijay

最新推荐文章于 2020-11-16 17:21:51 发布

阅读量498

点赞数

分类专栏： WEB开发必学必会

WEB开发必学必会专栏收录该内容

113 篇文章 0 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

这篇博客探讨了在处理XML文件时，使用jaxp和dom4j的区别，主要集中在DOM和SAX两种解析方式上。DOM将整个文件存储在内存中，适合简单操作，而SAX基于事件，适用于数据流处理，内存占用少。通过示例展示了这两种技术在DOM和SAX实现上的应用，以读取XML内容和标题。

摘要由CSDN通过智能技术生成

到位

原文地址：关于jaxp和dom4j【sax和dom对比】 作者：Hope

周五晚上，问了一下lj她的html到xhtml的转化是怎么变得，当时她说是通过jaxp,在我印象中jaxp就是用来解析、创建xml，但是为什么要用这种方式呢？通过比较，个人觉得还是dom4j比较好用。

下面分别以两种方式进行xml文件的读取，主要分为dom、SAX两种方式，那么两种方式有什么区别呢？

看了很多网页总结两者之间区别，各有利弊：

【DOM和SAX区别】

DOM:读取整个文件并将该文件存储在一个树结构中，而这样可能是低效的、缓慢的，并且很消耗资源:

SAX:是一个基于事件的 API，适用于处理数据流，即随着数据的流动而依次处理数据。

DOM:使用简单

SAX:

(1)不允许对XML文件随机存取,如：当前解析到第3个Element，此时程序无法得到第5个Element的信息，因为还没有解析到第5个Element；同样也无法得到第1个Element的信息，因为已经丢失了。当然可以通过声明变量保存解析过的数据，但这如同手动在内存中构造了某种数据结构，一般都是树型结构，这相当麻烦且没有必要，因为DOM恰恰提供了这样一个内存中的模型。

（2）SAX模型中元素之间的横向移动困难：SAX提供的是层次型的解析，便利所有第1个Element的子节点（一直到叶子节点）后，才可能开始解析下一个兄弟Element。而且很难知道某一时刻，解析到了哪个层次节点了。DOM则可以很好的解决这个问题，可以方便的找到任何兄弟节点。

（3）SAX是解析一个节点后回调一个方法，把该节点相关信息传送个调用者，然后丢弃这些信息，继续解析下一个节点。正是这样一个机制，使得SAX占用内存很少，它不会预存储整个XML文档，也不会在解析后保存任何解析结果。而DOM则正好相反，把整个XML加载进内存中，即使是延迟加载策略，也会浪费额外的性能为代价。所以当XML非常庞大的时候，还是需要首选SAX。

没有绝对的哪个好那个坏，只能说在某种情况下哪个更适合一些。

===========================

下面就以示例比较jaxp和dom4j:

【xml文件如下】

<?xml version="1.0" encoding="UTF-8"?>
<elements>
<element id="5">
    <attributes tdescription="属性区">
      <attr name="标题"><![CDATA[文章标题]]></attr>
      <attr name="文章ID"><![CDATA[文章ID]]></attr>
      <attr name="栏目"><![CDATA[我的栏目]]></attr>
      <attr name="重要性"><![CDATA[我的重要性]]></attr>
      <attr name="关键字"><![CDATA[我的关键字]]></attr>
      <attr name="摘要"><![CDATA[我的摘要]]></attr>
      <attr name="发布流水号"><![CDATA[我的流水号10768880]]></attr>
      <attr name="评论要求"><![CDATA[我的评论要求]]></attr>
      <attr name="创立时间"><![CDATA[我的创立时间20040816010101]]></attr>
      <attr name="发布时间"><![CDATA[我的发布时间20091125010101]]></attr>
      <attr name="修改时间"><![CDATA[我的修改时间20091201093658]]></attr>
    </attributes>
    <content description="正文区"><![CDATA[这是我的正文区]]></content>
</element>
</elements>