stax方法解析XML

原创 2013年12月03日 11:23:46
一SAX解析
   SAX(simple API for XML)是一种XML解析的替代方法。相比于DOM,SAX是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。而且相比于DOM,SAX可以在解析文档的任意时刻停止解析,但任何事物都有其相反的一面,对于SAX来说就是操作复杂。
 
(1)解析初步
  JAVA 解析 XML 通常有两种方式:DOM 和SAX。DOM(文档对象模型)是W3C标准,提供了标准的解析方式,但其解析效率一直不尽如人意,这是因为DOM解析XML文档时,把所有内容一次性的装载入内存,并构建一个驻留在内存中的树状结构(节点数)。如果需要解析的XML文档过大,或者我们只对该文档中的一部分感兴趣,这样就会引起性能问题。


(2)SAX的工作原理
     SAX,它既是一个接口,也是一个软件包.但作为接口,SAX是事件驱动型XML解析的一个标准接口不会改变 SAX的工作原理简单地说就是对文档进行顺序扫描,当扫描到文档(document)开始与结束、元素(element)开始与结束、文档(document)结束等地方时通知事件处理函数,由事件处理函数做相应动作,然后继续同样的扫描,直至文档结束。
  大多数SAX都会产生以下类型的事件:
  1.在文档的开始和结束时触发文档处理事件。
  2.在文档内每一XML元素接受解析的前后触发元素事件。
  3.任何元数据通常由单独的事件处理
  4.在处理文档的DTD或Schema时产生DTD或Schema事件。
  5.产生错误事件用来通知主机应用程序解析错误。

(3)SAX解析文档过程举例
  对于一个XML文档举例来说 <doc>
  <para>Hello,World!</para>
  </doc>
  其解析的过程为:
  1.start document
  2.start element:doc......
  3.start element:para.....
  4.characters:Hello,World!
  5.end element:para......
  6.end element;doc......
  7.end document
  对于解析过程中的每一步都会有事件发生,都会触发相应接口中的事件处理程序。
  编写程序的步骤为:
  (1).创建事件处理程序(也就是编写ContentHandler的实现类,一般继承自DefaultHandler类,采用adapter模式)
  (2).创建SAX解析器
  (3).将事件处理程序分配到解析器
  (4).对文档进行解析,将每个事件发送给事件处理程序

(4)SAX 模型
  过程:
  1.首先SAXParserFactory来创建一个SAXParserFactory实例
  SAXParserFactory factory = SAXParserFactory.newInstance();
  2.根据SAXParserFactory实例来创建SAXParser
  3.SAXParser产生SAXReader
  XMLReader reader = factory.newSAXParser().getXMLReader();
  4.XMLReader 加载XML,然后解析XML,在解析的过程中触发相对于接口中的事件处理程序

(5)SAX接口介绍
  ContentHandler接口 (主要用到的接口)
  ContentHandler是Java类包中一个特殊的SAX接口,位于org.xml.sax包中。该接口封装了一些对事件处理的方法,当XML解析器开始解析XML输入文档时,它会遇到某些特殊的事件,比如文档的开头和结束、元素开头和结束、以及元素中的字符数据等事件。当遇到这些事件时,XML解析器会调用ContentHandler接口中相应的方法来响应该事件。
  ContentHandler接口的方法有以下几种:
  void startDocument()
  void endDocument()
  void startElement(String uri, String localName, String qName, Attributes atts)
  void endElement(String uri, String localName, String qName)
  void characters(char[ ] ch, int start, int length)

DTDHandler接口
  DTDHandler用于接收基本的DTD相关事件的通知。该接口位于org.xml.sax包中。此接口仅包括DTD事件的注释和未解析的实体声明部分。SAX解析器可按任何顺序报告这些事件,而不管声明注释和未解析实体时所采用的顺序;但是,必须在文档处理程序的startDocument()事件之后,在第一个startElement()事件之前报告所有的DTD事件。
  DTDHandler接口包括以下两个方法
  void startDocumevoid notationDecl(String name, String publicId, String systemId) nt()
  void unparsedEntityDecl(String name, String publicId, String systemId, String notationName)
  EntityResolver接口
  EntityResolver接口是用于解析实体的基本接口,该接口位于org.xml.sax包中。
  该接口只有一个方法,如下:
  public InputSource resolveEntity(String publicId, String systemId)
  解析器将在打开任何外部实体前调用此方法。此类实体包括在DTD内引用的外部DTD子集和外部参数实体和在文档元素内引用的外部通用实体等。如果SAX应用程序需要实现自定义处理外部实体,则必须实现此接口。ErrorHandler接口
  ErrorHandler接口是SAX错误处理程序的基本接口。如果SAX应用程序需要实现自定义的错误处理,则它必须实现此接口,然后解析器将通过此接口报告所有的错误和警告。
  该接口的方法如下:
  void error(SAXParseException exception)
  void fatalError(SAXParseException exception)
  void warning(SAXParseException exception)

Java xml解析器SAX解析与StAX解析比较

最近了解到JDK6添加一个名为 StAX 的新解析方法,具体可以参考 在JDK 6.0 中基于 StAX 分析 XML 数据 。在J2ME 下可以使用 XmlPullParser ,参考 http:/...
  • zzy7075
  • zzy7075
  • 2016年05月21日 09:17
  • 1253

JavaEE实战——XML文档DOM、SAX、STAX解析方式详解

本文主要介绍XML文档作为存储和传输数据的三种解析方式,其各自主要的思想、实现方式、CURD实现,以及最后展示一个综合的实战例子加以巩固理解。...
  • zhongkelee
  • zhongkelee
  • 2016年06月22日 23:10
  • 2246

stax解析xml文档的6种方式

stax解析xml文档的方式: 基于光标的查询; 基于迭代模型的查找; 基于过滤器的查找; 基于xpath的查找; 使用 XMLStreamWriter 创建 xml 文档: 通过 Transform...
  • u011593278
  • u011593278
  • 2013年08月04日 10:53
  • 1346

使用Stax解析XML

完整版见https://jadyer.github.io/2013/03/19/xml-stax/
  • jadyer
  • jadyer
  • 2013年03月19日 15:03
  • 1838

使用 StAX 解析 XML

1、前言 本文大部分摘抄于IBM developerworks(主要是理论),详下面三篇文章,摘抄主要是为了使自己理解更深一点儿,仅当作笔记而已...也是为了以后再次使用时有个参考!摘抄并不全面...
  • zhangyihui1986
  • zhangyihui1986
  • 2013年02月01日 18:37
  • 2644

Stax处理XML(三)——XPath的使用和写文档、修改文档

(1)XPath的使用 前面讲了Stax处理XML的查找,有基于光标的查找,和基于迭代模型的查找。Stax也支持XPath查找。 /** * XPath的使用 * 查找category为WE...
  • linjingj
  • linjingj
  • 2013年12月31日 23:50
  • 2674

Java Stax操作XML简介

使用stax操作xml 非常的简单,它的读取过程像是一个光标在移动。针对不同的节点做不同的处理。 先看一个基于光标的模型处理xml:public class StaxTest { @Test ...
  • u012702547
  • u012702547
  • 2015年05月09日 16:30
  • 6222

使用StAX解析XML

http://blog.sina.com.cn/s/blog_5b8c66750100a7yc.html StAX 概述 从一开始,Java API for XML Processing ...
  • lqglqglqg
  • lqglqglqg
  • 2015年08月27日 11:35
  • 203

SAX解析xml带冒号

版权声明:使用署名-非商业性使用CC协议[http://creativecommons.org/licenses/by-nc/3.0/deed.zh] 目录(?)[+] ...
  • fdsdfadsfasdf
  • fdsdfadsfasdf
  • 2017年03月09日 17:57
  • 173

Stax解析XML的简单实例

Stax解析XML的简单实例
  • wwHRestarting
  • wwHRestarting
  • 2015年04月29日 14:24
  • 693
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:stax方法解析XML
举报原因:
原因补充:

(最多只允许输入30个字)