简介
dom4j是一个Java的XML API,是微软公司提供的用于解析xml的工具包,用来读写XML文件的。它是一个开放源代码的软件,可以在SourceForge上找到它,想看源码的朋友可以去看看。
引入依赖
解析xml文件一般都是源码框架汇总使用到的,比如Mybatis中解析config文件和xml文件。考虑到读者可能没有学过maven,这里给出两种引入依赖的方式
- 非maven项目:引入dom4j.jar ,这是微软提供的用于解析xml数据的工具包。它可以将整个xml文档读入内存,形成一颗dom树,然后通过dom树的操作方法来操作xml文档。
- maven项目引入下方依赖
<dependency>
<groupId>dom4j</groupId>
<artifactId>dom4j</artifactId>
<version>1.6.1</version>
</dependency>
示例代码
在解析.xml格式的数据时,需要引入dom4j依赖,并且添加到构建路径。它的解析过程是将整个xml文档读入内存,读成树状结构!我们通过获取根节点,以及根节点的子节点,的子节点…这种方式去获取数据。示例代码如下:
package com.jayden.test.code.java;
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import java.util.List;
public class TestDom4j {
public static void main(String[] args) {
// 1.指定文件路径
String path = "./src/main/java/com/jayden/test/code/java/Student.xml";
// 2.创建SAXReader对象
SAXReader reader = new SAXReader();
// 3.读取xml文档,返回Document对象
Document document = null;
try {
document = reader.read(path);
} catch (Exception e) {
e.printStackTrace();
}
// 4.获取根节点
Element root = document.getRootElement();
System.out.println(root.getName());
// 4.1 获取节点中的数据(注意:空格 换行也属于数据)
String text = root.getText();
System.out.println(text);
// 4.2 获取元素中的数据 trim去除多余空格
String textTrim = root.getTextTrim();
System.out.println(textTrim);
// 4.3 获取元素中的数据(包括子元素中的数据)
String textTrim1 = root.getStringValue();
System.out.println(textTrim1);
// 4.4 获取元素的标签名 就是当前元素的名字
String name = root.getName();
System.out.println(name);
// 5 获取第一个子元素(注意:是所有此类型子元素中的第一个)
Element student = root.element("student");
// 6. 获取所有某种类型的子元素
List studentList = root.elements("student");
// 7. 处理当前studentList
for (Object studentObj : studentList) {
Element element = (Element) studentObj;
// 7.1 获取属性值
String id = element.attributeValue("id");
System.out.println(id);
// 7.2 获取子元素
Element name1 = element.element("name");
// 7.3 获取子元素中的数据
String name2 = name1.getTextTrim();
System.out.println(name2);
// 7.4 获取子元素中的数据
String name3 = element.elementTextTrim("name");
System.out.println(name3);
}
}
}