XML文件解析
早期的jdk为我们提供了XML的两种解析技术DOM和SAX,但是这两种技术都已经过时了,现在用得最多的是DOM4j解析技术
DOM4j官网:https://dom4j.github.io/#
利用代码来理解DOM解析技术和DOM4j解析技术
<?xml version="1.0" encoding="UTF-8"?>
<names>
<name id="张三">
<age>33</age>
</name>
<name id="王二">
<age>34</age>
</name>
<name id="李四">
<age>23</age>
</name>
</names>
package DOM;
import org.dom4j.DocumentException;
import org.dom4j.io.SAXReader;
import org.junit.Test;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.IOException;
import java.util.List;
import static org.w3c.dom.Node.ELEMENT_NODE;
/**
* @ClassName : DomSolveDemo
* @Author : YuYun
* @Date : 2022-04-20 18:35:48
* @Description :利用DOM解析技术来解析XML文件
*/
public class DomSolveDemo {
/**
* @Description : 利用DOM解析技术来解析XML文件,完成文件的遍历
* @Author : YuYun
* @Date : 2022/4/20
*/
@Test
public void Test() throws ParserConfigurationException, IOException, SAXException {
// 创建DOM解析器工厂
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
// 利用DOM解析器工厂来创建一个DOM解析器对象
DocumentBuilder db = dbf.newDocumentBuilder();
// 利用DOM解析器对象的parse方法来解析,获得一个DOM对象
Document dom = db.parse("src/name.xml");
// 通过DOM对象来获得标签节点
Element root = dom.getDocumentElement();
NodeList childNodes = root.getChildNodes();
// 遍历XML 中的元素
for (int i = 0; i < childNodes.getLength(); i++) {
Node node = childNodes.item(i);
if(node.getNodeType() == ELEMENT_NODE){
Element element = (Element) node;
System.out.println(element.getAttribute("id"));
}
}
}
/**
* @Description : 利用DOM4j来解析XML文件,完成文件的遍历
* @Author : YuYun
* @Date : 2022/4/20
*/
@Test
public void test3() throws DocumentException {
// 还是要先获得一个DOM对象
SAXReader saxReader = new SAXReader();
org.dom4j.Document dom = saxReader.read("src/name.xml");
org.dom4j.Element root = dom.getRootElement();
// 每一个标签都是一个ELement ,知道这点。我们可以做很多的事情,比如,通过ELement来获得属性的值
List<org.dom4j.Element> elementList = root.elements();
for (org.dom4j.Element el:elementList) {
// 获得属性的值
String id = el.attributeValue("id");
System.out.println("id = " + id);
// 获得字标签的值
org.dom4j.Element age = el.element("age");
String ageText = age.getText();
System.out.println("ageText = " + ageText);
}
}
}
第一个测试运行结果:
id = 张三
content =
33
id = 王二
content =
34
id = 李四
content =
23
这里的运行结果很怪的原因是,即使是标签之间的一大段空格,也会被DOM解析成为一个节点
第二个测试的运行结果:
id = 张三
ageText = 33
id = 王二
ageText = 34
id = 李四
ageText = 23