Document节点
Document节点的两个直接子节点的类型分别是DocumentType类型和Element类型,其中的DocumentType节点对应着XML文件所关联的DTD文件,通过进一步获取该节点子孙节点来分析DTDL文件中的数据;而其中的Element类型节点对应着XML文件的根节点,通过进一步获取该Element类型节点子孙节点来分析XML文件中的数据。
Document 节点经常使用下列方法获取和该节点相关的信息。
Element getDocumentElement()
返回当前节点的Element子节点。
DocumentType getDoctype()
返回当前节点的DocumentType子节点。
NodeList getElementsByTagName(String name)
返回一个NodeList对象,该对象由当前节点的Element类型子孙节点组成,这些子孙节点的名字由参数name指定。
NodeList getElementsByTagNameNS(String namespaceURI,String localName)
返回一个NodeList对象,该对象由当前节点的Element类型子孙节点组成, 这些子孙节点的名字由参数localName指定,名称空间由参数namespaceURI 指定。
String getXmlEncoding()
返回XML文件使用的编码,即XML声明中encoding属性的值。
boolean getXmlStandalone()
返回XML声明中的standalone属性的值。未指定时返回NULL
standalone 用来表示该文件是否呼叫其它外部的文件。 这里所指的外部文件其实就是查检XML是不是有效的约束文件,或是DTD或是Schema
String getXmlVersion()
返回XML声明中的version属性的值
其中getXmlEncoding getXmlVersion getXmlStandalong在Android2.1中是没有的。
要解析的XML文件:
<?xml version="1.0" encoding="utf-8"?>
<rivers>
<river name="灵渠" length="605">
<introduction>
灵渠在广西壮族自治区兴安县境内,是世界上最古老的运河之一,有着“世界古代水利建筑明珠”的美誉。灵渠古称秦凿渠、零渠、陡河、兴安运河,于公元前214年凿成通航,距今已2217年,仍然发挥着功用。
</introduction>
<imageurl>
http://www.2cto.com/uploadfile/2012/0228/20120228094142711.jpg
</imageurl>
</river>
<river name="胶莱运河" length="200">
<introduction>
胶莱运河南起黄海灵山海口,北抵渤海三山岛,流经现胶南、胶州、平度、高密、昌邑和莱州等,全长200公里,流域面积达5400平方公里,南北贯穿山东半岛,沟通黄渤两海。胶莱运河自平度姚家村东的分水岭南北分流。南流由麻湾口入胶州湾,为南胶莱河,长30公里。北流由海仓口入莱州湾,为北胶莱河,长100余公里。
</introduction>
<imageurl>
http://www.2cto.com/uploadfile/2012/0228/20120228094142711.jpg
</imageurl>
</river>
<river name="苏北灌溉总渠" length="168">
<introduction>
位于淮河下游江苏省北部,西起洪泽湖边的高良涧,流经洪泽,青浦、淮安,阜宁、射阳,滨海等六县(区),东至扁担港口入海的大型人工河道。全长168km。
</introduction>
<imageurl>
http://www.2cto.com/uploadfile/2012/0228/20120228094142711.jpg
</imageurl>
</river>
</rivers>
private Document parseXML(InputStream is)
{ if(is == null) return null;
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
// dbf.setValidating(true);//设置检查XML文件的有效性
// dbf.setIgnoringElementContentWhitespace(true);//设置忽略空白
// dbf.setNamespaceAware(false);//设置为true时,由DocumentBuilderFactory产生的DOM解析器支持名称空间
DocumentBuilder db = null; //DOM解析器
Document doc = null;
try {
db = dbf.newDocumentBuilder();
} catch (ParserConfigurationException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
try {
doc = db.parse(is);//可以通过解析XML得到一个Document
// db.newDocument();//可以创建一个Document,然后修改它
} catch (SAXException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
DocumentType docType = doc.getDoctype();
String xmlEncoding = doc.getXmlEncoding();//android2.1不支持
String xmlVersion = doc.getXmlVersion();
boolean isAlone = doc.getXmlStandalone();//android2.1不支持
NodeList list = doc.getElementsByTagName("river");
int length = list.getLength();
for(int k = 0;k<length;k++)
{
Node node = list.item(k);
String nodeName = node.getNodeName();
String textContent = node.getTextContent();
//取得当前节点下的所有Text节点内容,这里就包括introduction下和imageUrl下的Text以及空格
}
return doc;
其中getXmlEncoding方法在XML设置了encoding的情况下,取不到,不知道为什么。
以上内容参考 耿祥义 出版的 XML基础教程(清华大学出版社) ,然后整理修改而成。