DOM解析器 (三)

Document节点


         Document节点的两个直接子节点的类型分别是DocumentType类型和Element类型,其中的DocumentType节点对应着XML文件所关联的DTD文件,通过进一步获取该节点子孙节点来分析DTDL文件中的数据;而其中的Element类型节点对应着XML文件的根节点,通过进一步获取该Element类型节点子孙节点来分析XML文件中的数据。

        

          Document 节点经常使用下列方法获取和该节点相关的信息。


          Element getDocumentElement()

           返回当前节点的Element子节点。


          DocumentType getDoctype()

          返回当前节点的DocumentType子节点。


          NodeList getElementsByTagName(String name)

          返回一个NodeList对象,该对象由当前节点的Element类型子孙节点组成,这些子孙节点的名字由参数name指定。


          NodeList getElementsByTagNameNS(String namespaceURI,String localName)

          返回一个NodeList对象,该对象由当前节点的Element类型子孙节点组成, 这些子孙节点的名字由参数localName指定,名称空间由参数namespaceURI    指定。


          String getXmlEncoding()

          返回XML文件使用的编码,即XML声明中encoding属性的值。


          boolean getXmlStandalone()

          返回XML声明中的standalone属性的值。未指定时返回NULL

          standalone  用来表示该文件是否呼叫其它外部的文件。    这里所指的外部文件其实就是查检XML是不是有效的约束文件,或是DTD或是Schema


          String getXmlVersion()

          返回XML声明中的version属性的值


           其中getXmlEncoding getXmlVersion getXmlStandalong在Android2.1中是没有的。


要解析的XML文件:

<?xml version="1.0" encoding="utf-8"?>
<rivers>
 <river name="灵渠" length="605">
     <introduction>
      灵渠在广西壮族自治区兴安县境内,是世界上最古老的运河之一,有着“世界古代水利建筑明珠”的美誉。灵渠古称秦凿渠、零渠、陡河、兴安运河,于公元前214年凿成通航,距今已2217年,仍然发挥着功用。
     </introduction>
      <imageurl>
      http://www.2cto.com/uploadfile/2012/0228/20120228094142711.jpg
     </imageurl>
   </river>
  
   <river name="胶莱运河" length="200">
     <introduction>
      胶莱运河南起黄海灵山海口,北抵渤海三山岛,流经现胶南、胶州、平度、高密、昌邑和莱州等,全长200公里,流域面积达5400平方公里,南北贯穿山东半岛,沟通黄渤两海。胶莱运河自平度姚家村东的分水岭南北分流。南流由麻湾口入胶州湾,为南胶莱河,长30公里。北流由海仓口入莱州湾,为北胶莱河,长100余公里。
     </introduction>
      <imageurl>
      http://www.2cto.com/uploadfile/2012/0228/20120228094142711.jpg
     </imageurl>
   </river>
  
   <river name="苏北灌溉总渠" length="168">
     <introduction>
      位于淮河下游江苏省北部,西起洪泽湖边的高良涧,流经洪泽,青浦、淮安,阜宁、射阳,滨海等六县(区),东至扁担港口入海的大型人工河道。全长168km。
     </introduction>
      <imageurl>
      http://www.2cto.com/uploadfile/2012/0228/20120228094142711.jpg
     </imageurl>
   </river>
 </rivers>

    private Document  parseXML(InputStream is)
    {   if(is == null) return null;
    	DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
//    	dbf.setValidating(true);//设置检查XML文件的有效性
//    	dbf.setIgnoringElementContentWhitespace(true);//设置忽略空白
//    	dbf.setNamespaceAware(false);//设置为true时,由DocumentBuilderFactory产生的DOM解析器支持名称空间
    	DocumentBuilder db = null; //DOM解析器
    	Document doc = null;
    	
    	try {
    		db = dbf.newDocumentBuilder();
		} catch (ParserConfigurationException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
		try {
		     doc = db.parse(is);//可以通过解析XML得到一个Document
//		     db.newDocument();//可以创建一个Document,然后修改它

		     
		} catch (SAXException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}

		
		DocumentType docType =  doc.getDoctype();
		
		String xmlEncoding = doc.getXmlEncoding();//android2.1不支持
		String xmlVersion = doc.getXmlVersion();
	        boolean isAlone = doc.getXmlStandalone();//android2.1不支持
	    
	    NodeList list = doc.getElementsByTagName("river");
	    int length = list.getLength();
	    for(int k = 0;k<length;k++)
	    {
	    	Node node = list.item(k);
	    	String nodeName = node.getNodeName();
	    	String textContent = node.getTextContent();
//取得当前节点下的所有Text节点内容,这里就包括introduction下和imageUrl下的Text以及空格
	    	
	    }
	

	return doc;

其中getXmlEncoding方法在XML设置了encoding的情况下,取不到,不知道为什么。


以上内容参考  耿祥义  出版的 XML基础教程(清华大学出版社) ,然后整理修改而成。








评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值