转载时请注明转自:http://blog.csdn.net/sam_zhang1984
交流可加新浪微博:Android开发人
解析 XML 有两种方式: SAX 和 DOM 。它们各有利弊。
DOM 是把 XML 文档全部装载到内存中,然后当成一树进行处理。其好处是当成树处理起来比较方便,但弊端是如果 XML 文件比较大时,会对内存消耗比较大;
SAX 是逐行扫描 XML 文档,逐行解析,而且可以在处理 XML 文档过程中的任意时刻中止处理过程,比如找到我们的目标节点,剩下的 XML 文档内容就可以不读了,直接结束。其弊端是操作起来相对不方便,而且对 XML 文档进行处理,如果修改、新增、删除等操作比较不方便。
SAX 是事件驱动型 XML 解析的一个标准接口。它的工作原理是读到文档的开始与结束、标签元素的开始与结束、内容实体等地方时,触发相应的函数,我们就可以在相应的函数中进行我们所要进行的处理。
XML 解析主要需要进行下列步骤:
1. 创建事件处理程序
2. 创建 SAX 解析器
3. 将事件处理程序分配给解析器
4. 对文档进行解析,将每个事件发送给处理程序。
创建事件处理程序,即实现ContentHandler 接口,但由于ContentHandler 里有很多方法,而不是我们必须要用到的,所以我们采用的办法是继承DefaultHandler。
当一个接口 A 中有很多方法,但我们并不需要那么多方法时,如果直接实现这个接口,则需要实现很多对我们没用的方法;于是就添加一个类 B ,去实现这个接口 A 中的所有方法,但这些方法都是空方法,这样,以后如果要用到接口 A 时,则不需要去实现 A ,而是直接继承类 B ,然后选一些我们需要的方法进行重写就行了。
而DefaultHandler就是实现了 ContentHandler 接口方法,但都是空方法,我们就是通过继承DefaultHandler 来创建自己的事件程序,并在相应的事件中对XML文件进行解析,代码如下:
- public class MyContentHandler extends DefaultHandler {
- private String strID,strMP3Name,strMP3Size,strLrcName,strLrcSize;
- private String strTagName;
- //读XML文件的内容
- @Override
- public void characters(char[] ch, int start, int length)
- throws SAXException {
- //把XML文件的实体内容读出来
- // System.out.println("characters "+strTagName);
- // System.out.println("characters "+ (new String(ch,start,length)));
- if (strTagName.equals("id")){
- strID = new String(ch,start,length);
- }
- else if (strTagName.equals("mp3.name")){
- strMP3Name = new String(ch,start,length);
- }
- else if (strTagName.equals("mp3.size")){
- strMP3Size = new String(ch,start,length);
- }
- else if (strTagName.equals("lrc.name")){
- strLrcName = new String(ch,start,length);
- }
- else if (strTagName.equals("lrc.size")){
- strLrcSize = new String(ch,start,length);
- }
- }
- //XML读取结束
- @Override
- public void endDocument() throws SAXException {
- System.out.println("the end of XML");
- }
- //结束XML文件的结点读取
- @Override
- public void endElement(String uri, String localName, String qName)
- throws SAXException {
- //如果读完一个标签则打印其结果
- strTagName = "";
- // System.out.println("endElement "+strTagName);
- if (localName.equals("resource")){
- displayResult();
- }
- }
- //开始读取XML文件
- @Override
- public void startDocument() throws SAXException {
- System.out.println("the start of XML");
- }
- //开始读取XML文件的结点
- @Override
- public void startElement(String uri, String localName, String qName,
- Attributes attributes) throws SAXException {
- strTagName = localName ; //记下当前的标签
- // System.out.println("startElement "+strTagName);
- }
- //打印结果
- public void displayResult(){
- System.out.println("The ID is " + strID );
- System.out.println("The MP3Name is " + strMP3Name);
- System.out.println("The MP3Size is " + strMP3Size );
- System.out.println("The ID LrcName is " + strLrcName );
- System.out.println("The ID LrcSize " + strLrcSize);
- }
- }
创建 SAX 解析器和 将事件处理程序分配给解析器,就是应用SAX的里面的函数,代码如下:
- //得到一个SAX工厂类
- SAXParserFactory myFactory=SAXParserFactory.newInstance();
- //得到一个XML读取器
- XMLReader myXMLReader= myFactory.newSAXParser().getXMLReader();
- //为XMLReader设置其内容处理程序
- myXMLReader.setContentHandler(new MyContentHandler());
- //解析XML文件
- myXMLReader.parse(new InputSource(new StringReader(strResult)));
注意 : ContentHandler 类 中的 characters 是在每一次读完标签后都执行一次,无论是开始标签还是结束标签,区别只在于开始标签读到的内容,即传进来的 char[] ch 是有值的(前提是这个标签有内容 ),而结束标签传进来的 char[] ch 是空的。所以为避免读到错误信息,必须在标签结束时,把存放标签名的变量赋空空值,不然执行完结束标签再去执行读 XML 实体函数 characters 时,就会以一个在判断时误判断成某一个标签,从而把一个空值(读结束标签后,当然是没有值的,所以调用 characters 传进来的值是空值 )赋给我们的目标。