关于SAX解析的讲解和一个简单的例子

关于SAX解析的讲解和一个简单的例子

SAXsimple API for XML)是一种XML解析的替代方法。相比于DOMSAX是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。而且相比于DOMSAX可以在解析文档的任意时刻停止解析,但任何事物都有其相反的一面,对于SAX来说就是操作复杂。

SAX解析和DOM解析对比

JAVA 解析 XML 通常有两种方式:DOM SAXDOM文档对象模型) 是W3C标准,提供了标准的解析方式,但其解析效率一直不尽如人意,这是因为DOM解析XML文档时,把所有内容一次性的装载入内存,并构建一个驻留在内 存中的树状结构(节点数)。如果需要解析的XML文档过大,或者我们只对该文档中的一部分感兴趣,这样就会引起性能问题

SAX解析工作原理

SAX,它既是一个接口,也是一个软件包.但作为接口,SAX事件驱动型 XML解析的一个标准接口不会改变      SAX的工作原理简单地说就是对文档进行顺序扫描,当扫描到文档(document)开始与结束、元素(element)开始与结束、文档 (document)结束等地方时通知事件处理函数,由事件处理函数做相应动作,然后继续同样的扫描,直至文档结束。

大多数SAX都会产生以下类型的事件:

1.在文档的开始和结束时触发文档处理事件。

2.在文档内每一XML元素接受解析的前后触发元素事件。

3.任何元数据通常由单独的事件处理

4.在处理文档的DTDSchema时产生DTDSchema事件。

5.产生错误事件用来通知主机应用程序解析错误。

一个简单的SAX解析例子

对于一个XML文档举例来说            <doc>

<para>Hello,World!</para>

</doc>

其解析的过程为:

1.start document

2.start element:doc......

3.start element:para.....

4.characters:Hello,World!

5.end element:para......

6.end element;doc......

7.end document

对于解析过程中的每一步都会有事件发生,都会触发相应接口中的事件处理程序。

编写程序的步骤为:

1.创建事件处理程序(也就是编写ContentHandler的实现类,一般继承自DefaultHandler类,采用adapter模式)

2.创建SAX解析器

3.将事件处理程序分配到解析器

4.对文档进行解析,将每个事件发送给事件处理程序

SAX解析模型

过程:

1.首先SAXParserFactory来创建一个SAXParserFactory实例

SAXParserFactory factory = SAXParserFactory.newInstance();

2.根据SAXParserFactory实例来创建SAXParser

3.SAXParser产生SAXReader

XMLReader reader = factory.newSAXParser().getXMLReader();

4.XMLReader 加载XML,然后解析XML,在解析的过程中触发相对于接口中的事件处理程序

SAX接口解析介绍

ContentHandler接口 (主要用到的接口)

ContentHandlerJava类包中一个特殊的SAX接口,位于org.xml.sax包 中。该接口封装了一些对事件处理的方法,当XML解析器开始解析XML输入文档时,它会遇到某些特殊的事件,比如文档的开头和结束、元素开头和结束、以及 元素中的字符数据等事件。当遇到这些事件时,XML解析器会调用ContentHandler接口中相应的方法来响应该事件。

ContentHandler接口的方法有以下几种:

void startDocument()//文件打开时调用

void endDocument()//当到文档的末尾调用

void startElement(String uri, String localName, String qName, Attributes atts)//当遇到开始标记时调用

void endElement(String uri, String localName, String qName)//当遇到节点结束时调用

void characters(char[ ] ch, int start, int length)//当分析器遇到无法识别为标记或者指令类型字符时调用

DTDHandler接口

DTDHandler用于接收基本的DTD相关事件的通知。该接口位于org.xml.sax包 中。此接口仅包括DTD事件的注释和未解析的实体声明部分。SAX解析器可按任何顺序报告这些事件,而不管声明注释和未解析实体时所采用的顺序;但是,必 须在文档处理程序的startDocument()事件之后,在第一个startElement()事件之前报告所有的DTD事件。

DTDHandler接口包括以下两个方法

void startDocumevoid notationDecl(String name, String publicId, String systemId) nt()

void unparsedEntityDecl(String name, String publicId, String systemId, String notationName)

EntityResolver接口

EntityResolver接口是用于解析实体的基本接口,该接口位于org.xml.sax包中。

该接口只有一个方法,如下:

public InputSource resolveEntity(String publicId, String systemId)

解析器将在打开任何外部实体前调用此方法。此类实体包括在DTD内引用的外部DTD子集和外部参数实体和在文档元素内引用的外部通用实体等。如果SAX应用程序需要实现自定义处理外部实体,则必须实现此接口。

ErrorHandler接口

ErrorHandler接口是SAX错误处理程序的基本接口。如果SAX应用程序需要实现自定义的错误处理,则它必须实现此接口,然后解析器将通过此接口报告所有的错误和警告。

该接口的方法如下:

void error(SAXParseException exception)

void fatalError(SAXParseException exception)

void warning(SAXParseException exception)

一个简单的android例子

 class ParseButtonListener implements OnClickListener{

@Override

public void onClick(View v) {

HttpDownloader hd = new HttpDownloader();

String resultStr = hd.download("http://192.168.1.107:8081/voa1500/test.xml");

System.out.println(resultStr);

try{

//创建一个SAXParserFactory

SAXParserFactory factory = SAXParserFactory.newInstance();

XMLReader reader = factory.newSAXParser().getXMLReader();

//XMLReader设置内容处理器

reader.setContentHandler(new MyContentHandler());

//开始解析文件

reader.parse(new InputSource(new StringReader(resultStr)));

}

catch(Exception e){

e.printStackTrace();

}

}

    

}

MyContentHandler接口的实现如下

public class MyContentHandler extends DefaultHandler {

String hisname, address, money, sex, status;

String tagName;

public void startDocument() throws SAXException {

System.out.println("````````begin````````");

}

public void endDocument() throws SAXException {

System.out.println("````````end````````");

}

public void startElement(String namespaceURI, String localName,

String qName, Attributes attr) throws SAXException {

tagName = localName;

if (localName.equals("worker")) {

//获取标签的全部属性

for (int i = 0; i < attr.getLength(); i++) {

System.out.println(attr.getLocalName(i) + "=" + attr.getValue(i));

}

}

}

public void endElement(String namespaceURI, String localName, String qName)

throws SAXException {

//workr标签解析完之后,会打印出所有得到的数据

tagName = "";

if (localName.equals("worker")) {

this.printout();

}

}

public void characters(char[] ch, int start, int length)

throws SAXException {

if (tagName.equals("name"))

hisname = new String(ch, start, length);

else if (tagName.equals("sex"))

sex = new String(ch, start, length);

else if (tagName.equals("status"))

status = new String(ch, start, length);

else if (tagName.equals("address"))

address = new String(ch, start, length);

else if (tagName.equals("money"))

money = new String(ch, start, length);

}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值