2018-04-28—XML解析(SAX解析)

大家还记得我们之前讲的Json串吗,那个东西解析起来 是不是挺麻烦的,等看完今天这篇文章,你就会觉得json解析好简单。没错,我们今天就要讲一下xml解析。



一、XML格式

首先大家对于xml应该都不会陌生,最常见的就是我们使用的layout.xml,他就是一个xml文件,而他的格式如下:
10608194-157f465690fea6db.png

这是一个最基本的xml,每一个<student></student>为一组标签,标签名为student,在<student     >中的name,id,sex,都是student的属性。而中间的<phone></phone>为他的内容,也是一组标签,标签名为phone。watch同上。

所以现在我们很明显看出来了,这是一个简单的两重嵌套xml。最外成的是标签名为student的外标签,它里面有三个属性分别是name,id,sex。他的内容有两个子标签,标签名分别为phone和watch。

注意:一定要很熟悉xml的嵌套结构,这样在编写解析代码时很有用。

然后我们一起来解析一下这个很简单的xml吧。

首先我们要知道Android中,解析xml有三种方式:SAX,Pull,和Dom。今天我们只看一下SAX的解析方式:



二、SAX方式解析XML

在解析之前呢,我们首先要有一个xml数据,大家还记得我们把本地的json串放在哪里了吗?没错在assets目录下。

10608194-9967b5c71a5fdec5.png


为了方便,我们创建一个类,专门用于解析xml。

10608194-ae9db7c2d1fca564.png

然后就开始正式解析过程了:

1.首先创建解析器工厂

10608194-cbf133bc4ebcb068.png

2.创建解析器:

10608194-5127ff701733846d.png

3.我们需要创建一个类去继承DefaultHandler类,来进行数据处理

1)我们需要重写如下的5个方法

10608194-f26a4ceba759e8fc.png

这五个方法分别是开始文档、开始标签、文本数据处理、结束标签、结束文档

开始文档和结束文档这两个方法可以理解为是在我们最开始和结束时候调用的方法。当我们收到了文件开头,就会进入开始文档方法,而末尾相反。

开始标签和结束标签这两个方法是在我们收到手标签和尾标签进入的方法。他们两个的参数都一样,分别是命名空间(现在不用管他)、标签名字、带命名空间的标签的名字、标签中的属性集。

我们只需要注意localName和attributes这两个参数就好。

2)startDocument重写

这个方法重写非常简单,我们只需要在里面创建一个list对象就好。

10608194-a891c4b7ca89cb72.png
10608194-e6c4bfcdc1486d5d.png

对了我们还需要一个Bean类,来对应我们xml中的数据,Beans类如上所示。

2)startElements方法重写

10608194-c76c1be87dfe64c2.png

我们通过一个全局的String对象tag来接收我们的标签名字,如果标签名字为student,那么我们通过attributes属性分别获取他的对应属性并且赋值。

有人可能会说还有两个标签watch和phone呢,这两个我们后面再说。

3)character方法重写

10608194-9ef87e275a9edc2f.png

我们上面说到的那两个标签在这里用到了,characters对应的三个属性分别是获取到的内容值,内容的起始位置,内容的长度。

我们先用一个string类接收内容值,然后一个空判断,接着给对应的标签加入内容值。

4)endElements

10608194-274ed8c936fd705e.png

这个方法重写很简单,我们判断标签如果是student,就把刚才赋值了的student对象传入list中,然后一定要把stduent和tag置空,为了下一次的操作。

endDocuments方法不用重写了。

5)别忘了返回我们得到的数据

10608194-51e0aee28d92f787.png

4.开始解析

10608194-d9b931ddaeac96bf.png

现在我们可以看一下日志:

10608194-1ba10da55a728d3f.png
zyXML 是一个轻便、小巧的,纯易语言代码来解析 XML的 模块。 优点: 1 、不依赖任何 DLL 、支持库、系统组件( Microsoft.XMLDOM 等对象) 2 、支持 UTF-8 、 UTF-16 等编码 3 、支持 XPath 语法来查询节点 4、支持 CDATA 5 、开源(如果有任何问题可以自己修改) 缺点: 1 、加载速度稍微逊色于支持库,但是查询速度很快。 2 、不支持 DTD ,也就是类似于如下的节点 ]> 3 、 XPath 查询语法支持不全(要全部支持太麻烦了,实在没精力去解析了) XPath 具体语法可参考: http://www.w3school.com.cn/xpath/xpath_syntax.asp 目前支持的 XPath 语法有限,不支持的有: 1 、查找只能返回节点,而不能返回属性,当然查找条件可以有属性,如:节点名 [@ 属性名\n='\n\u5c5e\u6027\u503c\n'] 2 、 [] 括号里面的谓语表达式 仅仅支持一个操作符号,且不支持 | 、 or 、 and 和 mod ,并且属性名不支持 * ,仅仅元素名才支持 * 3 、轴 不支持 following 、 namespace 、 preceding 和 preceding-sibling 4 、函数都不支持,但是可以有如下使用: node() 可返回所有节点且不管节点是什么类型 cdata() 仅查找 CDATA 类型的节点 text() 仅查找 文本 节点 comment() 仅查找 注释 节点 * 仅查找 元素 节点 举一些支持的例子 路径表达式 结果 bookstore 选取 bookstore 元素的所有子节点。 /bookstore 选取根元素 bookstore 。 注释:假如路径起始于正斜杠 (/ ) ,则此路径始终代表到某元素的绝对路径! bookstore/book 选取属于 bookstore 的子元素的所有 book 元素。 //book 选取所有 book 子元素,而不管它们在文档中的位置。 bookstore//book 选择属于 bookstore 元素的后代的所有 book 元素,而不管它们位于 bookstore 之下的什么位置 /bookstore/book[1] 选取属于 bookstore 子元素的第一个 book 元素。 /bookstore/book[last()] 选取属于 bookstore 子元素的最后一个 book 元素。 /bookstore/book[last()-1] 选取属于 bookstore 子元素的倒数第二个 book 元素。 //title[@lang] 选取所有拥有名为 lang 的属性的 title 元素。 //title[@lang='eng'] 选取所有 title 元素,且这些元素拥有值为 eng 的 lang 属性。 /bookstore/book[price>35.00] 选取 bookstore 元素的所有 book 元素,且其中的 price 元素的值须大于 35.00 。 /bookstore/book[price>35.00]/title 选取 bookstore 元素中的 book 元素的所有 title 元素,且其中的 price 元素的值须大于 35.00 。 child::book 选取所有属于当前节点的子元素的 book 节点。 child::* 选取当前节点的所有子元素。 child::text() 选取当前节点的所有文本子节点。 child::node() 选取当前节点的所有子节点。 descendant::book 选取当前节点的所有 book 后代。 ancestor::book 选择当前节点的所有 book 先辈。 ancestor-or-self::book 选取当前节点的所有 book 先辈以及当前节点(如果此节点是 book 节点) child::*/child::price 选取当前节点的所有 price 孙节点。 另外元素索引我好像弄成从 0 开始了,好像 XPath 本身索引是从 1 开始的。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值