DOM4J简介　

最新推荐文章于 2019-02-23 10:51:50 发布

qingtanlang

最新推荐文章于 2019-02-23 10:51:50 发布

阅读量1.6k

点赞数

分类专栏： JAVA方向技术文章标签： interface xml branch 文档 iterator 设计模式

本文链接：https://blog.csdn.net/qingtanlang/article/details/2628314

版权

JAVA方向技术专栏收录该内容

19 篇文章 0 订阅

订阅专栏

导读：
　　
　　一、DOM4J简介　
　　DOM4J是dom4j.org出品的一个开源XML解析包，DOM4J最大的特色是使用大量的接口，这也是它被认为比JDOM灵活的主要原因。它的主要接口都在org.dom4j这个包里定义：
　　Attribute 定义了XML属性
　　Branch Branch为能够包含子节点的节点如XML元素(Element)和文档(Docuemnts)定义了一个公共的行为
　　CDATA 定义了XML CDATA 区域
　　CharacterData CharacterData是一个标识借口，标识基于字符的节点。如CDATA，Comment, Text.
　　Comment Comment 定义了XML注释的行为
　　Document 定义了XML文档
　　DocumentType DocumentType 定义XML DOCTYPE声明
　　Element Element定义XML 元素
　　ElementHandler ElementHandler定义了 Element 对象的处理器
　　ElementPath 被 ElementHandler 使用，用于取得当前正在处理的路径层次信息
　　Entity Entity定义 XML entity
　　Node Node为所有的dom4j中XML节点定义了多态行为
　　NodeFilter NodeFilter 定义了在dom4j节点中产生的一个滤镜或谓词的行为（predicate）
　　ProcessingInstruction ProcessingInstruction 定义 XML 处理指令.
　　Text Text 定义XML 文本节点.
　　Visitor Visitor 用于实现Visitor模式.
　　XPath XPath 在分析一个字符串后会提供一个XPath 表达式
　　接口之间的继承关系如下所示：
　　interface java.lang.Cloneable
　　interface org.dom4j.Node
　　interface org.dom4j.Attribute
　　interface org.dom4j.Branch
　　interface org.dom4j.Document
　　interface org.dom4j.Element
　　interface org.dom4j.CharacterData
　　interface org.dom4j.CDATA
　　interface org.dom4j.Comment
　　interface org.dom4j.Text
　　interface org.dom4j.DocumentType
　　interface org.dom4j.Entity
　　interface org.dom4j.ProcessingInstruction
　　二、使用示例
　　1。读取并解析XML文档
　　读写XML文档主要依赖于org.dom4j.io包，其中提供DOMReader和SAXReader两类不同方式，而调用方式是一样的。
　　// 从文件读取XML，输入文件名，返回XML文档
　　public Document read(String fileName) throws MalformedURLException, DocumentException {
　　SAXReader reader = new SAXReader();
　　Document document = reader.read(new File(fileName));
　　return document;
　　}
　　其中，reader的read方法是重载的，可以从InputStream, File, Url等多种不同的源来读取。得到的Document对象就代表了整个XML。注意读取的字符编码是按照XML文件头定义的编码来转换。
　　2。取得ROOT结点
　　一切XML分析都是从Root元素开始的。
　　public Element getRootElement(Document doc){
　　return doc.getRootElement();
　　}
　　3。遍历XML树
　　DOM4J提供至少3种遍历节点的方法：
　　1) 枚举(Iterator)
　　// 枚举所有子节点
　　 for(Iteratori=root.elementIterator();i.hasNext();){
　　Elementelement=(Element)i.next();
　　// do something
　　}
　　// 枚举名称为foo的节点
　　 for(Iteratori=root.elementIterator(foo);i.hasNext();){
　　Elementfoo=(Element)i.next();
　　// do something
　　}
　　// 枚举属性
　　 for(Iteratori=root.attributeIterator();i.hasNext();){
　　Attributeattribute=(Attribute)i.next();
　　// do something
　　}
　　
　　2)递归
　　public void treeWalk() {
　　treeWalk(getRootElement());
　　}
　　public void treeWalk(Element element) {
　　for (int i = 0, size = element.nodeCount(); i
　　Node node = element.node(i);
　　if (node instanceof Element) {
　　treeWalk((Element) node);
　　} else { // do something....
　　}
　　}
　　}
　　3) Visitor模式
　　Visitor是GOF设计模式之一。其主要原理就是两种类互相保有对方的引用，并且一种作为Visitor去访问许多Visitable。只需要自定一个类实现Visitor接口即可。
　　public class MyVisitor extends VisitorSupport {
　　public void visit(Element element){
　　System.out.println(element.getName());
　　}
　　public void visit(Attribute attr){
　　System.out.println(attr.getName());
　　}
　　}
　　调用： root.accept(new MyVisitor())

本文转自
http://blog.csdn.net/flyingBox/archive/2006/01/09/574537.aspx