XML解析:
XML解析方式分为两种:dom和sax
SAX和DOM解析的比较
在针对XML文档的应用编程接口中,最主要的有W3C制定的DOM(Document Object Method,文档对象模型)和由David Megginson领导的SAX(SimpleAPI for XML,用于XML的简单API)。
SAX和DOM在实现过程中,分别侧重于不同的方面以满足不同的应用需求。DOM为开发基于XML的应用系统提供了便利。它通过一种随机访问机制,使得应用程序利用该接口可以在任何时候访问XML文档中的任何一部分数据,也可以对XML文档中的数据进行插入、删除、修改、移动等操作。在DOM中,文档的逻辑结构类似一棵树。文档、文档中的根、元素、元素内容、属性、属性值等都是以对象模型的形式表示的。DOM的优点在于它在内存中保存文档的整个模型。这使得能以任何顺序访问XML元素。然而,对于大型文档来说,这样做可能不方便。因为它可能会用尽内存,或者当系统达到了它的极限时,机器的性能将
会慢下来。
SAX提供了一种对XML文档进行顺序访问的模式,这是一种快速读XML数据的方式。SAX接口是事件驱动的,当使用SAX分析器对XML文档进行分析时,就会触发一系列事件,并激活相应的事件处理函数,从而完成对XML文档的访问。SAX处理XML的方式与DOM不同。SAX解析器不是将DOM树解析和表现为输出,它是基于事件的,所以在XML被解析时,事件被发送给引擎。SAX可以在文档的开始接收事件,也可以接收文档中的元素。使用这些事件可以构建一种结构。因为SAX没有把XML文档完全地加载到内存中,所以需要的系统资源较少,是一个分析大型XML文档的高效API。缺点是编写SAX比编写DOM复杂,这因为首先必须实现通知接口并维护状态,其次SAX不允许对文档进行随机访问,也没有提供像DOM那样的修改功能。
比较而言,DOM和SAX各有自己的应用场合。DOM适用于处理下面的问题:解析比较小的XML文件;需要对文档进行修改;需要随机对文档进行访问。SAX适于处理下面的问题:对大型文档进行处理;只需要文档的部分内容;只需要从文档中得到特定信息
dom:(Document Object Model, 即文档对象模型) 是 W3C 组织推荐的处理 XML 的一种方式。
sax: (Simple API for XML) 不是官方标准,但它是 XML 社区事实上的标准,几乎所有的 XML 解析器都支持它。
XML解析器
Crimson、Xerces 、Aelfred2
XML解析开发包
Jaxp、Jdom、dom4j
DOM:
Document Object Model 文档对象模型,由W3C制定标准规范 与具体语言无关 随机访问XML文档重复读
DOM的编程API:
Node:节点
Document :根节点表示整个文档
NodeList:节点的集合
NamedNodeMap:一般用于存储属性
Element:
编程思路:
1.获得DocumentBuilderFactory的实例
2.通过工厂获得DocumentBuilder的解析器
3.parse(File)======>Documen
L文档时,会把文档中的所有元素,按照其出现的层次关系,解析成一个个Node对象(节点)。
在dom中,节点之间关系如下:
位于一个节点之上的节点是该节点的父节点(parent)
一个节点之下的节点是该节点的子节点(children)
同一层次,具有相同父节点的节点是兄弟节点(sibling)
一个节点的下一个层次的节点集合是DOM模型(document object model)
DOM解析器在解析XM节点后代(descendant)
父、祖父节点及所有位于节点上面的,都是节点的祖先(ancestor)
SAX:
Simple Api for XML (xml简单处理API),提供了一种基于事件的XML的解析方式
多用于快速读取XML文档
基于事件驱动,在内存中并不会加载整个文档,效率要高(解析大型XML文档)
不能重复读取 顺序读取模式
1.得到工厂实例
SAXParserFactory actory=SAXParserFactory.newInstance();
2.由工厂实例得到 解析器
SAXParser parser=factory.newSAXParser();
3.解析器 parse (File f,MyHandler extends DefaultHandler dh)
Class MyHandler extends DefaultHandler{
public void …
}