Android中XML的三种解析方式

最新推荐文章于 2021-05-25 17:37:14 发布

Qunxing_Hu

最新推荐文章于 2021-05-25 17:37:14 发布

阅读量7.5k

点赞数 7

分类专栏： Android学习文章标签： android xml SAX-Pull

本文链接：https://blog.csdn.net/willmax_007/article/details/51416963

版权

Android学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

XML解析方式

Android 提供了三种解析XML的方式：SAX(Simple API XML), DOM(Document Object Model), Pull
本文中所用的XML文档内容如下：

<apps>
  <app>
    <id>1</id>
    <name>Google maps</name>
    <version>1.0</version>
  </app>
  <app>
     <id>2</id>
     <name>chrome</name>
     <version>2.1</version>
  </app>
  <app>
     <id>3</id>
     <name>google play</name>
     <version>3.1</version>
  </app> 
</apps>

1. SAX解析方式

SAX(Simple API for XML)解析器是一种基于事件的解析器，事件驱动的流式解析方式是，从文件的开始顺序解析到文档的结束，不可暂停或倒退。
优点：解析速度快，占用内存少。非常适合在Android移动设备中使用。
缺点：不会记录标签的关系，而要让你的应用程序自己处理，这样就增加了你程序的负担。
工作原理：对文档进行顺序扫描，当扫描到文档(document)开始与结束、元素(element)开始与结束、文档 (document)结束等地方时通知事件处理函数，由事件处理函数做相应动作，然后继续同样的扫描，直至文档结束。
使用步骤：
1. 新建 ContentHanlder 类继承 DefaultHandler 类，并重写父类的五个方法

startDocument(): 开始解析XML时调用
startElement(): 开始解析某个结点时调用
characters(): 在获取节点内容时调用
endElement(): 在完成解析某个结点时调用
endDocument(): 在完成整个XML解析的时候调用

2.创建函数 parseXMLWithSAX
3.调用函数 parseXMLWithSAX 解析 XML

代码如下：
新建 ContentHandler 类继承 DefaultHandler类，重写五个父类方法

public class ContentHandler extends DefaultHandler {
    private String nodeName;
    private StringBuilder id;
    private StringBuilder name;
    private StringBuilder version;
    private String TAG = "SAX";
    //开始解析 XML 文档
    @Override
    public void startDocument() throws SAXException {
        id = new StringBuilder();
        name = new StringBuilder();
        version = new StringBuilder();
    }
    //开始解析结点
    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
    //localName 记录当前结点的名字
        nodeName = localName;
    }
    //开始提取结点中内容
    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
        if("id".equals(nodeName))
            id.append(ch,start,length);
        else if("name".equals(nodeName))
            name.append(ch,start,length);
        else if("version".equals(nodeName))
            version.append(ch,start, length);
    }
    //结束结点解析
    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {
        if("app".equals(localName)){
            //可能包含回车或换行符
            Log.d(TAG, "endElement: id = " + id.toString().trim());
            Log.d(TAG, "endElement: name = "+ name.toString().trim());
            Log.d(TAG, "endElement: version = "+ version.toString().trim());
            //打印结束后清空，否则会影响下一次内容的读取
            id.setLength(0);
            name.setLength(0);
            version.setLength(0);
        }
    }
    //结束XML文档解析
    @Override
    public void endDocument() throws SAXException {
    }
}

创建函数 parseXMLWithSAX

//用SAX方式解析XML
private void paraseXMLWithSAX(String xmlData){
    try {
        SAXParserFactory factory = SAXParserFactory.newInstance();
        XMLReader reader = factory.newSAXParser().getXMLReader();
        ContentHandler handler = new ContentHandler();
       //将contentHandler的实例设置到XMLReader中
       reader.setContentHandler(handler);
       //开始解析
       reader.parse(new InputSource(new StringReader(xmlData)));
  }catch(Exception e){
        e.printStackTrace();
  }
}

调用的时候只需传入xmlData即可

**【注：在Android API中，另外提供了Android．util．Xml类，同样可以解析XML文件，使用方法类似SAX，也都需编写Handler来处理XML的解析，但是在使用上却比SAX来得简单，如下所示：
以android．util．XML实现XML解析：
MyHandler myHandler=new MyHandler0；
android．util．Xm1．parse(ur1．openC0nnection()．getlnputStream0，Xm1．Encoding．UTF-8，myHandler)；】**

2. Pull 方式解析

PULL解析器的运行方式和SAX类似，都是基于事件的模式。不同的是，在PULL解析过程中返回的是数字，且我们需要自己获取产生的事件然后做相应的操作，而不像SAX那样由处理器触发一种事件的方法，执行我们的代码。
**解析过程：**XML pull提供了开始元素和结束元素。当某个元素开始时，我们可以调用parser．nextText从XML文档中提取所有字符数据。当解释到一个文档结束时，自动生成EndDocument事件。

读取到xml的声明返回 START_DOCUMENT;
读取到xml的开始标签返回 START_TAG
读取到xml的文本返回 TEXT
读取到xml的结束标签返回 END_TAG
读取到xml的结束返回 END_DOCUMENT

优点： PULL解析器小巧轻便，解析速度快，简单易用，非常适合在Android移动设备中使用，Android系统内部在解析各种XML时也是用PULL解析器，Android官方推荐开发者们使用Pull解析技术。Pull解析技术是第三方开发的开源技术，它同样可以应用于JavaSE开发。

//用Pull方式解析XML
private void parseXMLWithPull(String xmlData){
   try {
     XmlPullParserFactory  factory = XmlPullParserFactory.newInstance();
     XmlPullParser xmlPullParser = factory.newPullParser();
     //设置输入的内容
     xmlPullParser.setInput(new StringReader(xmlData));
     //获取当前解析事件，返回的是数字
     int eventType = xmlPullParser.getEventType();
     //保存内容
     String id = "";
     String name = "";
     String version="";

     while (eventType != (XmlPullParser.END_DOCUMENT)){
          String nodeName = xmlPullParser.getName();
          switch (eventType){
          //开始解析XML
          case XmlPullParser.START_TAG:{
               //nextText()用于获取结点内的具体内容
               if("id".equals(nodeName))
                   id = xmlPullParser.nextText();
               else if("name".equals(nodeName))
                   name = xmlPullParser.nextText();
                else if("version".equals(nodeName))
                   version = xmlPullParser.nextText();
            } break;
          //结束解析
          case XmlPullParser.END_TAG:{
                if("app".equals(nodeName)){
                   Log.d(TAG, "parseXMLWithPull: id is "+ id);
                   Log.d(TAG, "parseXMLWithPull: name is "+ name);
                   Log.d(TAG, "parseXMLWithPull: version is "+ version);
                 }
                } break;
          default: break;
          }
          //下一个
          eventType = xmlPullParser.next();
    }
    } catch (Exception e) {
        e.printStackTrace();
    }
}

3. DOM方式解析

DOM，即对象文档模型，它是将整个XML文档载入内存(所以效率较低，不推荐使用)，每一个节点当做一个对象，结合代码分析。DOM实现时首先为XML文档的解析定义一组接口，解析器读入整个文档，然后构造一个驻留内存的树结构，这样代码就可以使用DOM接口来操作整个树结构。由于DOM在内存中以树形结构存放，因此检索和更新效率会更高。但是对于特别大的文档，解析和加载整个文档将会很耗资源。当然，如果XML文件的内容比较小，采用DOM是可行的。
工作原理：使用DOM对XML文件进行操作时，首先要解析文件，将文件分为独立的元素、属性和注释等，然后以节点树的形式在内存中对XML文件进行表示，就可以通过节点树访问文档的内容，并根据需要修改文档。
使用步骤：
采用DOM解析时具体处理步骤是：

首先利用DocumentBuilderFactory创建一个DocumentBuilderFactory实例
然后利用DocumentBuilderFactory创建DocumentBuilder
然后加载XML文档（Document)
然后获取文档的根结点(Element)，
然后获取根结点中所有子节点的列表（NodeList），
然后使用再获取子节点列表中的需要读取的结点。

总结：三种方式的总结比较

SAX是一个用于处理XML事件驱动的“推”模型，
优点是一种解析速度快并且占用内存少的xml解析器，它需要哪些数据再加载和解析哪些内容。
缺点是它不会记录标签的关系，而要让你的应用程序自己处理，这样就增加了你程序的负担。

DOM是一种文档对象模型，DOM可以以一种独立于平台和语言的方式访问和修改一个文档的内容和结构。
**优点：**Dom技术使得用户页面可以动态地变化，如可以动态地显示或隐藏一个元素，改变它们的属性，增加一个元素等，Dom技术使得页面的交互性大大地增强。
缺点：是DOM解析XML文件时，会将XML文件的所有内容以文档树方式存放在内存中。

Pull解析和Sax解析很相似,Pull解析和Sax解析不一样的地方是pull读取xml文件后触发相应的事件调用方法返回的是数字，还有pull**可以在程序中控制想解析到哪里就可以停止解析。**

DOM方式最直观和容易理解，但是只适合XML文档较小的时候使用，而SAX方式更适合在移动终端系统中使用，因为相比DOM占用内存少，适合处理比较大的XML文档，最后的Pull方式使用场合和SAX类似，但是更适合需要提前结束XML文档解析的场合。