xml解析

  1. 在java应用开发中我们和xml打交道得机会太平凡了,一般情况下我看会用JDOM或是DOM4j来解析我们得XML文件,下面是一个Dom4j解析xml文件得例子,其中包括了对xml文件得取值、赋值、提取节点、节点得遍历等。
  2. SAXReader reader = new SAXReader();   
  3. Document doc = reader.read(...);   
  4. List childNodes = doc.selectNodes("//Config/Child/ChildNode" );   
  5. for (Object obj:childNodes) {   
  6. Node childNode = (Node)obj;   
  7.   
  8. String name = childNode.valueOf("@name" );   
  9. String text = childNode.getText();   
  10. }   
  11.   
  12.   
  13.   
  14. 一.Document对象相关  
  15.   
  16. 1 .读取XML文件,获得document对象.  
  17.               SAXReader reader = new SAXReader();  
  18.               Document    document = reader.read(new File( "input.xml" ));  
  19.   
  20. 2 .解析XML形式的文本,得到document对象.  
  21.               String text = "<members></members>" ;  
  22.               Document document = DocumentHelper.parseText(text);  
  23. 3 .主动创建document对象.  
  24.               Document document = DocumentHelper.createDocument();  
  25.               Element root = document.addElement("members" ); // 创建根节点   
  26. 二.节点相关  
  27.   
  28. 1 .获取文档的根节点.  
  29. Element rootElm = document.getRootElement();  
  30. 2 .取得某节点的单个子节点.  
  31. Element memberElm=root.element("member" ); // "member"是节点名   
  32. 3 .取得节点的文字  
  33. String text=memberElm.getText();也可以用:  
  34. String text=root.elementText("name" );这个是取得根节点下的name字节点的文字.  
  35.   
  36. 4 .取得某节点下名为 "member" 的所有字节点并进行遍历.  
  37. List nodes = rootElm.elements("member" );  
  38.   
  39. for (Iterator it = nodes.iterator(); it.hasNext();) {  
  40.      Element elm = (Element) it.next();  
  41.    // do something   
  42. }  
  43. 5 .对某节点下的所有子节点进行遍历.  
  44.             for (Iterator it=root.elementIterator();it.hasNext();){  
  45.                   Element element = (Element) it.next();  
  46.                 // do something   
  47.               }  
  48. 6 .在某节点下添加子节点.  
  49. Element ageElm = newMemberElm.addElement("age" );  
  50. 7 .设置节点文字.  
  51. ageElm.setText("29" );  
  52. 8 .删除某节点.  
  53. parentElm.remove(childElm);// childElm是待删除的节点,parentElm是其父节点   
  54. 9 .添加一个CDATA节点.  
  55.           Element contentElm = infoElm.addElement("content" );  
  56.           contentElm.addCDATA(diary.getContent());  
  57.   
  58. 三.属性相关.  
  59. 1 .取得某节点下的某属性  
  60.               Element root=document.getRootElement();      
  61.               Attribute attribute=root.attribute("size" ); // 属性名name   
  62. 2 .取得属性的文字  
  63.               String text=attribute.getText();也可以用:  
  64. String text2=root.element("name" ).attributeValue( "firstname" );这个是取得根节点下name字节点的属性firstname的值.  
  65.   
  66. 3 .遍历某节点的所有属性  
  67.               Element root=document.getRootElement();      
  68.             for (Iterator it=root.attributeIterator();it.hasNext();){  
  69.                   Attribute attribute = (Attribute) it.next();  
  70.                   String text=attribute.getText();  
  71.                   System.out.println(text);  
  72.               }  
  73. 4 .设置某节点的属性和文字.  
  74. newMemberElm.addAttribute("name" , "sitinspring" );  
  75. 5 .设置属性的文字  
  76.               Attribute attribute=root.attribute("name" );  
  77.               attribute.setText("sitinspring" );  
  78. 6 .删除某属性  
  79.               Attribute attribute=root.attribute("size" ); // 属性名name   
  80.               root.remove(attribute);  
  81. 四.将文档写入XML文件.  
  82. 1 .文档中全为英文,不设置编码,直接写入的形式.  
  83. XMLWriter writer = new XMLWriter( new FileWriter( "output.xml" ));  
  84. writer.write(document);  
  85. writer.close();  
  86. 2 .文档中含有中文,设置编码格式写入的形式.  
  87.               OutputFormat format = OutputFormat.createPrettyPrint();  
  88.               format.setEncoding("GBK" );     // 指定XML编码           
  89.               XMLWriter writer = new XMLWriter( new FileWriter( "output.xml" ),format);  
  90.               
  91.               writer.write(document);  
  92.               writer.close();  
  93. 五.字符串与XML的转换  
  94. 1 .将字符串转化为XML  
  95. String text = "<members> <member>sitinspring</member> </members>" ;  
  96. Document document = DocumentHelper.parseText(text);  
  97. 2 .将文档或节点的XML转化为字符串.  
  98.               SAXReader reader = new SAXReader();  
  99.               Document    document = reader.read(new File( "input.xml" ));              
  100.               Element root=document.getRootElement();                  
  101.               String docXmlText=document.asXML();  
  102.               String rootXmlText=root.asXML();  
  103.               Element memberElm=root.element("member" );  
  104.               String memberXmlText=memberElm.asXML();  
  105.   
  106.   
  107.   
  108.   
  109. dom4j API 包含一个解析 XML 文档的工具。本文中将使用这个解析器创建一个示例 XML 文档。清单 1 显示了这个示例 XML 文档,catalog.xml。  
  110.   
  111. 清单 1 . 示例 XML 文档(catalog.xml)   
  112. <?xml version="1.0" encoding= "UTF-8" ?>   
  113. <catalog>   
  114. <!--An XML Catalog-->   
  115. <?target instruction?>  
  116.    <journal title="XML Zone"    
  117.                    publisher="IBM developerWorks" >   
  118. <article level="Intermediate" date= "December-2001" >  
  119. <title>Java configuration with XML Schema</title>   
  120. <author>   
  121.       <firstname>Marcello</firstname>   
  122.       <lastname>Vitaletti</lastname>   
  123. </author>  
  124.    </article>  
  125.    </journal>   
  126. </catalog>  
  127.    
  128.   
  129.   
  130. 然后使用同一个解析器修改 catalog.xml,清单 2 是修改后的 XML 文档,catalog-modified.xml。  
  131.   
  132. 清单 2 . 修改后的 XML 文档(catalog-modified.xml)   
  133. <?xml version="1.0" encoding= "UTF-8" ?>   
  134. <catalog>   
  135. <!--An XML catalog-->   
  136. <?target instruction?>  
  137.    <journal title="XML Zone"   
  138.                     publisher="IBM developerWorks" >   
  139. <article level="Introductory" date= "October-2002" >  
  140. <title>Create flexible and extensible XML schemas</title>   
  141. <author>   
  142.       <firstname>Ayesha</firstname>   
  143.       <lastname>Malik</lastname>   
  144. </author>   
  145.    </article>  
  146.    </journal>   
  147. </catalog>  
  148.    
  149.   
  150.   
  151. 与 W3C DOM API 相比,使用 dom4j 所包含的解析器的好处是 dom4j 拥有本地的 XPath 支持。DOM 解析器不支持使用 XPath 选择节点。  
  152.   
  153. 本文包括以下几个部分:  
  154.   
  155. 预先设置   
  156. 创建文档   
  157. 修改文档   
  158. 预先设置  
  159.   
  160. 这个解析器可以从 http://dom4j.org 获 取。通过设置使 dom4j-1.4/dom4j-full.jar 能够在 classpath 中访问,该文件中包括 dom4j 类、 XPath 引擎以及 SAX 和 DOM 接口。如果已经使用了 JAXP 解析器中包含的 SAX 和 DOM 接口,向 classpath 中增 加 dom4j-1.4/dom4j.jar 。 dom4j.jar 包括 dom4j 类和 XPath 引擎,但是不含 SAX 与 DOM 接 口。   
  161.   
  162.   
  163.   
  164.    
  165.   
  166.   
  167. 回页首   
  168.    
  169.   
  170.   
  171.   
  172. 创建文档  
  173.   
  174. 本节讨论使用 dom4j API 创建 XML 文档的过程,并创建示例 XML 文档 catalog.xml。  
  175.   
  176. 使用 import 语句导入 dom4j API 类:  
  177.   
  178. import org.dom4j.Document;  
  179. import org.dom4j.DocumentHelper;  
  180. import org.dom4j.Element;  
  181.    
  182.   
  183.   
  184. 使用 DocumentHelper 类创建一个文档实例。 DocumentHelper 是生成 XML 文档节点的 dom4j API 工厂类。   
  185.   
  186. Document document = DocumentHelper.createDocument();   
  187.   
  188.   
  189. 使用 addElement() 方法创建根元素 catalog 。 addElement() 用于向 XML 文档中增加元素。   
  190.   
  191. Element catalogElement = document.addElement("catalog" );   
  192.   
  193.   
  194. 在 catalog 元素中使用 addComment() 方法添加注释“An XML catalog”。   
  195.   
  196. catalogElement.addComment("An XML catalog" );   
  197.   
  198.   
  199. 在 catalog 元素中使用 addProcessingInstruction() 方法增加一个处理指令。   
  200.   
  201. catalogElement.addProcessingInstruction("target" , "text" );   
  202.   
  203.   
  204. 在 catalog 元素中使用 addElement() 方法增加 journal 元素。   
  205.   
  206. Element journalElement =   catalogElement.addElement("journal" );   
  207.   
  208.   
  209. 使用 addAttribute() 方法向 journal 元素添加 title 和 publisher 属性。   
  210.   
  211. journalElement.addAttribute("title" , "XML Zone" );  
  212.           journalElement.addAttribute("publisher" , "IBM developerWorks" );   
  213.   
  214.  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值