安卓常用的xml解析主要就是SAX(Simple API for XML)、DOM和Poll xmlpoll。
使用方法可以参考:
http://www.cnblogs.com/devinzhang/archive/2012/01/16/2323668.html。
看了示例,我感觉SAX需要自行继承Handler,用起来比较麻烦,不考虑。DOM和Poll对比的话,我喜欢Poll。
原因:
(1)主要接口
DOM
类 | 用途 |
---|---|
javax.xml.parsers.DocumentBuilderFactory | 一来就工厂 |
org.w3c.dom.Document | 文档数据结构 |
org.w3c.dom.Element | 包含子节点数据结构 |
org.w3c.dom.Node | 节点 |
org.w3c.dom.NodeList | 节点集 |
输出还要
类 | 用途 |
---|---|
javax.xml.transform.TransformerFactory | 又是工厂 |
javax.xml.transform.Transformer | Document到StreamResult的转换器 (javax.xml.transform.TransformerException) |
javax.xml.transform.dom.DOMSource | Document输入 |
javax.xml.transform.stream.StreamResult | 输出 |
java.io.PrintWriter | 将Stream流输出到OutStream,如文件流 |
javax.xml.transform.OutputKeys | 设置Indent用 |
示例:
Document document;
OutputStream stream;
...
Transformer tf = TransformerFactory.newInstance().newTransformer();
DOMSource source = new DOMSource(document);
tf.setOutputProperty(OutputKeys.INDENT, "yes");
PrintWriter pw = new PrintWriter(stream);
StreamResult result = new StreamResult(pw);
tf.transform(source, result);
Poll
类 | 用途 |
---|---|
android.util.Xml | Xml.newPullParser() |
org.xmlpull.v1.XmlPullParser | 读取,异常处理是(XmlPullParserException) |
org.xmlpull.v1.XmlSerializer | 写入 |
XXReader | 读取方法 |
示例:
FileOutputStream stream;
XmlSerializer serializer = Xml.newSerializer();
serializer.setFeature("http://xmlpull.org/v1/doc/features.html#indent-output", true);
serializer.setOutput(stream, "UTF-8");
比DOM简单很多。
(2)DOM在解析时存在一个坑,如果xml使用了indent(缩进),则其会额外生成一些TEXT_NODE的节点,使用时最好先trim掉,否则解析处理不当会出错。更好的做法是使用getElementsByTagName()来获取,这样会自动避免掉TEXT_NODE。
推荐方法1 getElementsByTagName:
NodeList userNodes = rootNode.getElementsByTagName("user");
for (int i = 0; i < userNodes.getLength(); i++) {
UserInfo info = new UserInfo();
readUser(info, (Element)userNodes.item(i));
data.put(info.username, info);
}
方法2 trim掉TEXT_NODE:
public class DocumentHelper {
public static boolean isBlank(Node node) {
if (node.getNodeType() == Node.TEXT_NODE) {
String value = node.getNodeValue();
// trim head & tail invisible char(\n\r\t)
value = value.trim();
if (value.isEmpty()) {
return true;
}
}
return false;
}
private static void scanNode(Node node) {
NodeList nodeList = node.getChildNodes();
for (int i = nodeList.getLength() - 1; i >= 0; i--)
{
if (isBlank(nodeList.item(i))) {
node.removeChild(nodeList.item(i));
} else if (node.getNodeType() == Node.ELEMENT_NODE) {
scanNode(nodeList.item(i));
}
}
}
public static void trim(Document document) {
Element root = document.getDocumentElement();
scanNode(root);
}
}
(3)DOM接口使用较烦,比如要获取属性值,需要调用
childNode.getAttributes().getNamedItem("name").getNodeValue()
才能获取到。
发现使用Element来访问也很简便:
if (childNode.getNodeType() != Node.ELEMENT_NODE) {
continue;
}
Element element = (Element)childNode;
String strName = element.getAttribute("name");
而使用Poll则只要
parser.getAttributeValue(null, "name")
(4)支持Indent方法
DOM
DOMSource source = new DOMSource(document);
tf.setOutputProperty(OutputKeys.INDENT, "yes");
Poll
serializer.setFeature("http://xmlpull.org/v1/doc/features.html#indent-output", true);
(5)适用场景
DOM适合把XML保存在内存中的情况,Poll适合一次性解析文件即销毁的情况。