结合http://www.2cto.com/kf/201112/112873.html和自己的理解,对xmlpullparser用法体会
Pull解析方法给应用程序完全的控制文档该怎么样被解析。Android中对Pull方法提供了支持的API,主要是
org.xmlpull.v1.XmlPullParser;
org.xmlpull.v1.XmlPullParserFactory;
二个类,其中主要使用的是XmlPullParser,XmlPullParserFactory是一个工厂,用于构建XmlPullParser对象。
应用程序通过调用XmlPullParser.next()等方法来产生Event,然后再处理Event。可以看到它与Push方法的不同,Push方法是由Parser自己主动产生Event,回调给应用程序。而Pull方法是主动的调用Parser的方法才能产生事件。
假如XML中的语句是这样的:"<author country="United States">James Elliott</author>",author是TAG,country是ATTRIBUTE,"James Elliott"是TEXT。
要想解析文档先要构建一个XmlPullParser对象
final XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
factory.setNamespaceAware(true);
final XmlPullParser parser = factory.newPullParser();
Pull解析是一个遍历文档的过程,每次调用next(),nextTag(), nextToken()和nextText()都会向前推进文档,并使Parser停留在某些事件上面,但是不能倒退。
然后把文档设置给Parser
parser.setInput(new StringReader("<author country=\"United States\">James Elliott</author>");
这时,文档刚被初始化,所以它应该位于文档的开始,事件应该是START_DOCUMENT,可以通过XmlPullParser.getEventType()来获取。然后调用next()会产生
START_TAG,这个事件告诉应用程序一个标签已经开始了,调用getName()会返回"author";再next()会产生
TEXT事件,调用getText()会返回"James Elliott",再next(),会产生
END_TAG,这个告诉你一个标签已经处理完了,再next(),会产生
END_DOCUMENT,它告诉你整个文档已经处理完成了。
除了next()外,nextToken()也可以使用,只不过它会返回更加详细的事件,比如COMMENT, CDSECT, DOCDECL, ENTITY等等非常详细的信息。如果程序得到比较底层的信息,可以用nextToken()来驱动并处理详细的事件。需要注意一点的是TEXT事件是有可能返回空白的White Spaces比如换行符或空格等。
另外有二个非常实用的方法nextTag()和nextText()
nextTag()--首先它会忽略White Spaces,如果可以确定下一个是START_TAG或END_TAG,就可以调用nextTag()直接跳过去。通常它有二个用处:当START_TAG时,如果能确定这个TAG含有子TAG,那么就可以调用nextTag()产生子标签的START_TAG事件;当END_TAG时,如果确定不是文档结尾,就可以调用nextTag()产生下一个标签的START_TAG。在这二种情况下如果用next()会有TEXT事件,但返回的是换行符或空白符。
假如是下面这个xml文件。当第一次得到startTag时,是info,如果调用next(),那么event的返回值是TEXT,也就是4。这时候要么是调用getAttributeCount()或者getAttributeName(index)等getAttribute***()相关函数得到startTag和text之间的值,即上面的country="United States"。但是info下面没有text,是子tag,因此调用getText出错。上面红色部分则解释了用nextTag的好处,就是直接到另一个startTag,即ver。
<?xml version="1.0" encoding="utf-8"?>
<info>
<ver>2.0</ver>
<desc>fggg</desc>
<apkurl>http://10.10.5.218/app/mobilesafe/mobilesafe.apk</apkurl>
</info>
nextText()--它只能在START_TAG时调用。当下一个元素是TEXT时,TEXT的内容会返回;当下一个元素是END_TAG时,也就是说这个标签的内容为空,那么空字串返回;这个方法返回后,Parser会停在END_TAG上。还有一个是getText,此方法则需要在event是4的时候才能使用,且不会停在endtag上。
1.当在START_TAG时,调用next(),会返回TEXT或者event=4(一般是是调用getText,此处只是说明next()在各种tag后的效果),再next返回END_TAG或者event=3。
2.当在END_TAG时,调用next(),会返回event=4.(我没有明白为什么?为什么不是返回2),再调用next才是START_TAG或者event=1.因此在endtag调用next()时,要两次。但是不可以换成一次nextTag(),因为如果endtag后面是enddocument会出错(原因???)。
3.当START_TAG没有TEXT,而是有子tag时,即上面的<info>这种情况时,next()是会返回TEXT或者event=4(如果此时调用gettext返回null),再调用next就子starttag,需要两次。也可以换成一次nextTag()。
4.此外,如果是START_DOCUMENT,只需一次next就可以到startTag.