Dom4j解析和创建XML文档

最新推荐文章于 2022-05-27 18:09:09 发布

湉湉老爸

最新推荐文章于 2022-05-27 18:09:09 发布

阅读量517

点赞数

分类专栏： J2EE 文章标签： xml dom4j

J2EE 专栏收录该内容

104 篇文章 1 订阅

订阅专栏

dom4j是一套开源的XML解析工具，完全支持DOM,SAX和JAXP机制，与传统的Xerces-J相比，dom4j更为简单易用，因此实际项目中往往采用它作为xml解析器。

dom4j只提供了java版本的，往往有很多的开源项目都使用它作为解析器比如hibernate框架。

dom4j支持多种解析机制：

DOMReader :它负责根据W3C的DOM树创建dom4j树。

SAXReader:它基于SAX解析机制来解析一份XML文档，并将其转换为dom4j树。

XPP3Reader:其底层需要依赖于XML Pull Parser 3.x来解析XML文档，并将其装换为dom4j树。

XPPReader :他是基于XML pull Parser 2.x的解析器，目前不支持注解，CDATA和处理指令。

使用dom4j解析xml文档 （代码来源《疯狂xml讲义》）

使用它来解析xml文档非常简单，在将xml文档转换成dom4j树之后，程序就可使用一致的编程模型来处理xml文档。

这里要注意的是导入包的时候一定不能出错，因为在java自己的jdk中也有

    Java代码   
    
  
 package com.gengu;  
   
 import java.io.File;  
 import java.util.List;  
   
 import org.dom4j.io.SAXReader;  
 import org.dom4j.Document;  
 import org.dom4j.Element;  
 import org.dom4j.Attribute;  
   
 public class test1 {  
   
     public static void main(String[] args) throws Exception{  
         //创建启用DTD验证功能的SAXReader对象  
         SAXReader reader = new SAXReader();  
         Document document = reader.read(new File("F:/新建文件夹/TestDom4j/src/com/gengu/Student.xml"));  
         Element root = document.getRootElement();  
         parse(root);  
     }  
   
     public static void parse(Element element){  
         //处理当前元素包含的所有属性  
         parseAttribute(element);  
         //获取当前元素包含的所有子元素  
         @SuppressWarnings("rawtypes")  
         List el = element.elements();  
         //遍历每个子元素  
         for(Object e: el){  
             Element element2 = (Element)e;  
             if(!element2.isTextOnly()){  
                 parse(element2);  
             }else {  
                 parseAttribute(element2);  
                 System.out.println(element2.getQName().getName()+"----->"+element2.getText());  
             }  
         }  
           
     }  
     //定义一个方法处理元素的所有属性  
     public static void parseAttribute(Element ele){  
         //获取Element元素的所有属性  
         @SuppressWarnings("rawtypes")  
         List attList = ele.attributes();  
         for(Object e:attList){  
             Attribute attribute = (Attribute)e;  
             System.out.println(ele.getQName().getName()+"元素的"  
                     +attribute.getQName().getName() + "的属性知为："  
                     +attribute.getValue()  
                     );  
         }  
     }  
 }  

下面一种是使用访问者模式来遍历XML文档

dom4j的Node接口是一个根接口，它定义了一个accept（Visitor visitor）方法。

    Java代码   
    
  
 package com.gengu;  
   
 import java.io.File;  
 import java.io.IOException;  
   
 import org.dom4j.*;  
 import org.dom4j.io.XPP3Reader;  
 import org.xmlpull.v1.XmlPullParserException;  
   
 /** 
  * 使用访问者模式遍历xml文档 
  * dom4j的Node接口中定义了一个accept(Visitor visitor)方法，该方法是在node接口中定义的  
  * */  
 public class test3 {  
   
     public static void main(String[] args) throws DocumentException, IOException, XmlPullParserException {  
         //使用XPP3Reader来解析XML文档  
         XPP3Reader reader = new XPP3Reader();  
         Document document = reader.read(new File("F:/新建文件夹/TestDom4j/src/com/gengu/Student.xml"));  
         document.accept(new YeekuVisitor());  
     }  
       
 }  
   
 class YeekuVisitor extends VisitorSupport{  
     //保存当前正在处理的节点  
     private String currentElement;  
     //当Visitor访问元素时回调该方法  
     public void visit(Element node){  
         //如果节点内容全部是文本  
         if(node.isTextOnly()){  
             System.out.println(node.getName() + "元素的信息" + node.getText());  
         }  
         currentElement = node.getName();  
     }  
     //当Visitor访问属性时回调该方法  
     public void visit(Attribute node){  
         System.out.println(currentElement + "元素的"  
                 + node.getName() + "属性的值是："  
                 + node.getText());  
     }  
     //当Visitor访问处理指令的时候回调该方法  
     public void visit(ProcessingInstruction node){  
         System.out.println("处理指令"  
                 + node.getTarget() + "的内容是："  
                 + node.getText());  
     }  
 }  

至于什么时候访问者模式，我讲在模式博客中仔细描述。

使用dom4j创建xml文档

使用dom4j创建xml文档，也很简单，只需要记住基本的Element，attribute即可。一个实例如下

    Java代码   
    
  
 package com.gengu;  
   
 import java.io.FileWriter;  
 import java.io.IOException;  
   
 import org.dom4j.*;  
 import org.dom4j.io.HTMLWriter;  
 import org.dom4j.io.OutputFormat;  
 import org.dom4j.io.XMLWriter;  
   
 public class test2 {  
   
     public static void main(String[] args) throws IOException {  
         //创建一个DocumentFactory duixiang   
         DocumentFactory factory = new DocumentFactory();  
         //创建一个Document对象  
         Document document = factory.createDocument();  
         //向Document对象中添加一个处理指令节点  
         //document.addProcessingInstruction("crazyit", "website=\"http://www.crazyit.org\"");  
         //向doc中添加根节点元素  
         Element root = document.addElement("书籍列表");  
         //采用循环的方式添加四个子元素  
         for(int i = 0 ;i<4;i++){  
             //创建一个计算机书籍子元素  
             Element pcBook = root.addElement("计算机书籍");  
             //添加一个随机数作为isbn的属性  
             Element name = pcBook.addElement("名字");  
             name.setText("编程思想");  
               
         }  
           
         OutputFormat  format = new OutputFormat("   ",true,"gbk");  
         //FileWriter fwFileWriter = new FileWriter("F:/book.XHTML");  
         FileWriter fw = new FileWriter("F:/book.xml");  
         //定义一份XLWriter对象  
         //HTMLWriter writer = new HTMLWriter(fw, format);  
         XMLWriter writer = new XMLWriter(fw,format);  
         writer.write(document);  
         fw.close();  
     }  
 }