dom4j创建、解析xml以及应用xpath查询元素

最新推荐文章于 2023-08-22 09:51:52 发布

原创最新推荐文章于 2023-08-22 09:51:52 发布 · 798 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#dom4j #java #xpath #xml

java 专栏收录该内容

16 篇文章

订阅专栏

本文介绍了DOM4J，一种高效的Java XML解析技术，详细解析了DOM4J的基本概念、类结构及其创建与解析XML文档的过程。同时，还探讨了DOM4J如何结合XPath进行高效的数据检索。

xml的两种解析原理

xml解析方式分为两种： DOM（Document Object Model）和SAX（Simple API for XML），

首相说明，这两种方式不是针对Java的xml解析技术，而是跨语言的解析方式，比如：JavaScript中就有dom解析技术。

DOM解析原理

dom解析方式的原理：要求解析器把整个xml文档装载进一个document对象之中，该对象中包含文档元素和所有的xml中的元素。

这种解析方式的优点和缺点：

优点是：xml解析之后，整个文档的结构和关系，清晰的存在于内存之中。

缺点是：把整个文档都读入内存，如果文档内容过大，将会导致内存溢出，浪费内存。

sax解析原理

sax解析方式的原理：sax解析和dom解析是一样的，都是一行一行的读取文件的内容，但是dom是最终将整个文档都放入document ，而sax是，不会保存任何数据，也就是说，sax读取本行内容的时候，会返回当前的对象，但是上一行查询不到，当解析完整个xml的时候，sax工作也就结束了。

优点：使用sax解析xml文档，不会占用很多内存，速度快，效率高

缺点：不能完整的保存整个文档对象以及他们之间的关系，无法进行一些增删改的操作，但是如果仅仅要查询xml中的元素，sax是一个不错的选择。

dom4j解析技术

1.dom4j的定义

dom4j是一种针对Java开发的xml解析技术，不想dom技术是跨语言的。dom4j综合了dom技术和sax解析技术。

2.dom4j的类结构图：

dom4j结构类图

这里与JavaScript的dom解释的方式还是有一些区别的，在这里看到attribute还是一个节点，但是在JavaScript中，属性已经不是节点了，要记住。

Branch是可以有子节点的节点，

3.dom4j创建xml文档

3.1创建xml文档对象

Document doc = DocumentHelper.createDocument();

3.2.创建根节点

1.首先创建一个元素节点

Elementroot = DocumentHelper.createElement (“root”);

2.将这个元素节点，添加到根节点位置

doc.setRootElement(root);

3.3.给元素添加属性

public Element addAttribute(Stringname,String value);

name:是指定属性名

value:指定属性值

代码;

给根元素添加属性：

root.addAttribute(“id”,”1”);

3.4.创建子元素

public Element addElement(String name);

name:指定子节点的名称

代码：

给根元素添加子元素book

Element book=root.addElement(“book”);

3.5.给元素节点添加文本节点

public void setText(Stringtext);------------将普通文本作为节点内容

public void addCDATA(String data)--------将CDATA段作为节点内容

代码;

给book节点设置文本

book.setText(“图书”)；

给book设置CDATA

book.addCDATA(“小王子&鲁滨孙漂流记”);

3.6.添加注释

public Element addComment(Stirng comment);

comment:指定注释内容

代码

给book节点，添加注释

book.addComment(“这里是介绍一本书”)

3.7.输出xml到硬盘，并且设置格式和编码

输入xml的类：

XMLWriterwriter = new XMLWriter (output,format);

output:指定输出流和输出到的文件。

format:设置输出格式---是OutputFormat格式的。

OutputFormat类常用的方法：

public static OutputFormat createPrettyprint();----设置有缩进的xml文档，不然的话就会是没有缩进的，很难看

public void setEncoding(String encoding)------设置编码集

代码

输入document到aaa.xml上面

StringfileUrl = “aaa.xml”;

OutputFormatformat = OutputFormat. createPrettyprint();

format.setEncoding(“utf-8”);

XMLWriterwriter = new XMLWriter(new FileWriter(fileUrl),format);

writer.write(doc);

writer.close();

3.8.一个完整的实例

publicclass CreateXml {

publicstatic void main(String[] args) throws Exception {

Documentdocument = DocumentHelper.createDocument();

Elementroot = document.addElement("book");

document.setRootElement(root);

root.addComment("这是一个描写书的xml");

Elementbname = root.addElement("bname");

bname.addComment("这是书名");

bname.addAttribute("id","1");

bname.setText("linux从入门到精通");

Elementbauthor = root.addElement("bauthor");

bname.addAttribute("id","2");

OutputFormatformat = OutputFormat.createPrettyPrint();

format.setEncoding("utf-8");

XMLWriterxmlWriter = new XMLWriter(new FileOutputStream(new File("src/b1.xml")),format);

xmlWriter.write(document);

xmlWriter.close();

}

结果：

<?xml version="1.0" encoding="utf-8"?>

<book>

linux从入门到精通

</bname>

</book>

4.解析xml文档

4.1.创建解析器

SAXReader reader = new SAXReader();

4.2.构建xml文档对象

解析器对象，有一个read方法，就可以创建文本对象

public Document read(File file) throwsDocuemtException

file:用于指定要解析的xml文件。

String fileUrl =“aaa.xml”;

Documentdoc = reader.read(new File(fileUrl));

4.3.获取根节点

public Element getRootElement();

返回值：根节点对象，Element类型

代码;

获取根节点

Element root = doc. getRootElement();

4.4.获取子节点

1.获取元素节点中的第一个指定名称的子元素节点

publicElement element(String name);

name:用于指定获取子节点的名字

代码：

返回根节点中名字为book的子元素节点

Elementbook = root.element(“book”);

2.获取元素节点中的所有指定名字的子元素节点

public List elements(Stringname);

name:指定的元素的名字

返回值：list集合

代码：

返回根节点中名字为book的所有子元素节点

List<Element>books= root.elements(“book”);

4.5.删除元素节点的属性，文本，和子节点

remove(Element ele);----------删除指定的子元素节点

remove(Attribute att);----------删除元素的属性

remove(Text text);-------------删除元素的文本

5.dom4j对xpath的支持

5.1.xpath是什么：

XPath即为XML路径语言（XML Path Language），它是一种用来确定XML文档中某部分位置的语言。xpath使用路径表达式来选取文档中的节点或者节点集，注意xpath是把xml文档中的属性，元素，文本，注释，等都封装成了节点对象，请参照上面的图，对nodes操作。使用路径的方式来进行操作。