Android学习笔记（八）XML文档的解析

最新推荐文章于 2024-09-07 14:54:28 发布

ekenlinbing

最新推荐文章于 2024-09-07 14:54:28 发布

阅读量712

点赞数

分类专栏：学习文章标签： xml 文档 android attributes string import

本文链接：https://blog.csdn.net/ekenlinbing/article/details/7833031

版权

学习专栏收录该内容

19 篇文章 0 订阅

订阅专栏

一、废话

　　最近几天四川一直下雨，冷!今天到成都的时候，下午3点多的天和晚上天差不多，黑呼呼的... ...难道传说的2012来了?哈哈哈... ...

二、正文　　

　　在上一篇笔记中提到过说在Android系统中，存储数据的方式除了SQLite外，还有很多其他的方式，比较常用的就是XML方式。在Android中，比较常用的XML解析方式有SAX方式和DOM方式。下面就来看看这两种方式吧。

1、 SAX解析

　　SAX——Simple API for XML，在org.xml.sax包中被提供使用。SAX是基于事件驱动的，有事件就一定有事件源，这个事件源就是SAX解析XML时的一个XMLReader对象。当XMLReader对象读取到XML文件的开始和结束标签时或者在取到一个节点内容时，都会触发在Handler（事件处理器）中注册的相应事件。

　　在XMLReader中可以通过setContentHandler(ContentHandler handler)方法来调用我们自己的Handler，而这个Handler就是我们解析XML文件的核心。我们可以通过继承SDK中的DefaultHandler类来实现一个我们自己的Handler。针对我们今天的主题，主要需要实现以下几个方法。

public void startDocument() throws SAXException{}——读取到文档时触发的事件，通常可以通过这个事件来处理一些IO错误之类的事情。
public void startElement(String uri, String localName, String qName,Attributes attributes) throws SAXException{}——读取到XML文档内容中的标签时触发，如<work></work>中的<work>标签。
- uri XML文档中NameSpace的URI，如果不清楚XML文档中Namespace的可以去网上看看。
- localName 无前缀的标签名，如<works><work></work></works>标签，返回的可以是work字符串。
- qName 有前缀具有完整路径的标签名，如<works><work></work></works>中返回的是/works/work字符串。
- attributes 标签中的属性名，如<work id=”111”></work>这里面的id就是属性，而”111”就是属性值。
public void endElement(String uri, String localName, String qName)throws SAXException{}——读取到XML文档内容中的结束标签时触发。
public void endDocument() throws SAXException{}——读取到XML文档结尾时触发该事件。
public void characters(char[] ch, int start, int length)throws SAXException{}——读取到XML文档某个标签下的内容时，就会调用这个方法返回该内容。
- ch 内容的字符值。
- start 读取的开始位置。
- length 读取的内容长度。

　　a) 现在来理下要解析XML文档的整个思路

- 新建一个SAXParserFactory对象，通过该对象的newSAXParser()方法来获得一个SAXParser对象。
- 通过SAXParser对象的getXMLReader()方法来获得一个XMLReader对象。
- 利用XMLReader对象的setConentHandler()方法来注册一个我们自己的Handler对象。
- 利用XMLReader对象的parse()方法来开始处理我们的XML文档。
- 实现自己的Handler类。

　　b) 普通方式下的解析

 1 package LiB.XMLDemo;
 2 
 3 import org.xml.sax.Attributes;
 4 import org.xml.sax.SAXException;
 5 import org.xml.sax.helpers.DefaultHandler;
 6 
 7 public class SAXHandler extends DefaultHandler {
 8 
 9     String tagName;
10     //当有值存在时，就调用该方法解析取值（如果是空值，也会调用这个方法）
11     @Override
12     public void characters(char[] ch, int start, int length)
13             throws SAXException {
14         String value= new String(ch, start,length);
15         if(tagName.equals("name"))
16         {
17             System.out.println("name="+ value);
18         }
19          if(tagName.equals("age"))
20         {
21             System.out.println("age="+value);
22         }
23     }
24 　　
25     @Override
26     public void endDocument() throws SAXException {
27 
28             System.out.println("---end----");
29     }
30 
31     @Override
32     public void endElement(String uri, String localName, String qName)
33             throws SAXException {
34         if(localName.equals("work"))
35         {
36             System.out.println("-----end----work");
37         }
38     }
39 
40     @Override
41     public void startDocument() throws SAXException {
42 
43             System.out.println("---begin----");
44     }
45 
46     @Override
47     public void startElement(String uri, String localName, String qName,
48             Attributes attributes) throws SAXException {
49         tagName = localName;
50         if(localName.equals("work"))
51         {
52             for(int i=0;i< attributes.getLength();i++)
53             {
54                 System.out.println(attributes.getLocalName(i)+"="+attributes.getValue(i));
55             }
56         }
57     }
58 
59 }

　　上面这个方法中存在一个问题：在读取出来的数据中，没区分开始标签和结束标签，所以出现了空值的状况。这个问题我一直都很奇怪，因为在不久前我处理的时候是不存在这个问题的，可是现在出现了。

　　c) 改进后的解析

　　解决的方法在网上也挺多的，而且大家都比较相似，就是在startElement和endElement方法中设置相应的标志位，然后在characters方法中通过标志位来决定是否需要读取它的内容。

　　修改后的方法有兴趣的朋友可以把源码下载下来看看。

2、 DOM解析

　　DOM方式解析XML文件呢，就需要将整个XML文档装入我们的手机内存中，如果文档过大，那么将非常的耗费内存，但是这样的好处是解析速度很快，同时DOM解析方式可以只解析你需要的那个部分，灵活性非常大。

　　DOM解析的原理呢，其实就是把动过DOM API访问XML文档的树形结构，并获取相应的数据。在java中通过DOM解析XML文件，一般会涉及到以下几个类。

DocumentBuilderFactory——创建DocumentBuilder对象的工厂类。
DocumentBuilder——通过这个方法可以创建一个能够获取Document实例的API。
Document——加载XML文档的入口，这是解析文档的源所在。
Element——元素，在DOM中，所有的节点都可以称作Element。
NodeList——节点的集合。

　　来看看通过DOM方式解析XML文档的步骤吧：

通过javax.xml.parsers包中的DocumentBuilderFactory类的newInstance()方法新建一个DocumentBuilderFactory对象。
通过DocumentBuilderFactory对象的newDocumentBuilder ()方法创建一个DoucumentBuilder对象。
通过DoucumentBuilder的parse()方法读取外部流来创建一个Document对象。
通过Document对象来获得文档中的所有节点的根节点。
通过根节点来解析所需要的文件内容。

 1 package LiB.XMLDemo;
 2 
 3 
 4 import javax.xml.parsers.DocumentBuilder;
 5 import javax.xml.parsers.DocumentBuilderFactory;
 6 
 7 import org.w3c.dom.Document;
 8 import org.w3c.dom.Element;
 9 import org.w3c.dom.Node;
10 import org.w3c.dom.NodeList;
11 import org.xml.sax.InputSource;
12 
13 public class DomHandler {
14     public static void GetStringFromDom(InputSource inputSource) {
15         try {
16             DocumentBuilderFactory factory = DocumentBuilderFactory
17                     .newInstance();
18             DocumentBuilder builder = factory.newDocumentBuilder();
19             Document document = builder.parse(inputSource);
20             //获取根节点
21             Element rootElement = document.getDocumentElement();
22             //获取第一级子节点
23             NodeList nodeList = rootElement.getElementsByTagName("work");
24             for(int i=0 ; i<nodeList.getLength();i++)
25             {
26             //String work = rootElement.getElementsByTagName("name").item(0).getFirstChild().getNodeValue();
27 
28                 Element workElement = ((Element)nodeList.item(i));
29                 //获取节点中的属性值
30 //String attr= workElement.getAttribute("XXX");
31 //通过节点的标签名字来获取值
32                 String name = workElement.getElementsByTagName("name").item(0).getFirstChild().getNodeValue();
33                 String age = workElement.getElementsByTagName("age").item(0).getFirstChild().getNodeValue();
34                 System.out.println("name="+name);
35                 System.out.println("age="+age);
36             }
37 
38         } catch (Exception e) {
39         }
40     }
41 }