声明:本博文是基于慕课网《java眼中的xml文件写入》视频的学习。文中的资源来自于慕课网
XML解析有四种方式:DOM SAX DOM4J JDOM
其中,DOM和SAX是java官方提供的解析xml的方法,另外两种是第三方开源提供的解析方法。
下面介绍这四种方式:
我们需要解析的xmll文件如下:
<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
<book id="1">
<name>冰与火之歌</name>
<author>乔治马丁</author>
<year>2014</year>
<price>89</price>
</book>
<book id="2">
<name>安徒生童话</name>
<year>2004</year>
<price>77</price>
<language>English</language>
</book>
</bookstore>
下面是我们要将解析后的xml封装成的类:
package com.xml.parse;
public class Book {
private String id;
private String name;
private String author;
private String year;
private String price;
private String language;
public String getId() {
return id;
}
public void setId(String id) {
this.id = id;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public String getAuthor() {
return author;
}
public void setAuthor(String author) {
this.author = author;
}
public String getYear() {
return year;
}
public void setYear(String year) {
this.year = year;
}
public String getPrice() {
return price;
}
public void setPrice(String price) {
this.price = price;
}
public String getLanguage() {
return language;
}
public void setLanguage(String language) {
this.language = language;
}
}
1.Dom解析
package com.xml.parse;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
public class DOMTest {
public static void main(String[] args) throws Exception {
// 创建一个DocumentBuilderFactory的对象
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
// 创建DocumentBuilder的对象
DocumentBuilder db = dbf.newDocumentBuilder();
// 通过DocumentBuilder对象的parse方法加载books.xml文件到当前项目下
Document document = db.parse("src/book.xml");
// 获取所有book节点的集合
NodeList bookList = document.getElementsByTagName("book");
// 通过NodeList的getLength()方法可以获取bookList的长度
System.out.println("一共有" + bookList.getLength() + "本书");
// 遍历每个book节点
for (int i = 0; i < bookList.getLength(); i++) {
System.out.println("==================下面开始遍历第" + (i + 1) + "本书的内容===========");
// 通过item(i)方法获取一个book节点,nodeList的索引值0开始
Node book = bookList.item(i);
// 获取book节点的所有属性集合
NamedNodeMap attrs = book.getAttributes();
System.out.println("第" + (i + 1) + "本书共有" + attrs.getLength()
+ "个属性");
// 遍历book的属性
for (int j = 0; j < attrs.getLength(); j++) {
// 通过item(index)方法获取book节点的某一个属性
Node attr = attrs.item(j);
// 获取属性名
System.out.println("属性名:" + attr.getNodeName());
// 获取属性值
System.out.println("属性值:" + attr.getNodeValue());
}
// 前提:已经知道book节点有且只能有1个id属性
// //将book节点进行强制类型转换,转换成Element类型
// Element book = (Element) bookList.item(i);
// //通过getAttribute("id")方法获取属性值
// String attrValue = book.getAttribute("id");
// System.out.println("id属性的属性值为" + attrValue);
// 解析book节点的子节点
NodeList childNodes = book.getChildNodes();
// 遍历childNodes获取每个节点的节点名和节点值
//System.out.println("第" + (i + 1) + "本书共有" + childNodes.getLength()+ "个子节点");
for (int k = 0; k < childNodes.getLength(); k++) {
// 区分出text类型的node以及element类型的node
if (childNodes.item(k).getNodeType() == Node.ELEMENT_NODE) {
// 获取了element类型节点的节点名
System.out.print("第" + (k + 1) + "个节点的节点名:"+ childNodes.item(k).getNodeName());
// 获取了element类型节点的节点值
System.out.println("--节点值是:"+ childNodes.item(k).getTextContent());
}
}
System.out.println("===============结束遍历第" + (i + 1)
+ "本书的内容=======================");
}
}
}
实验结果:
上面的实验结果,为什么会打印出9个子节点,我们看book.xml文件的book节点下只有四个子节点的啊,这是因为算入了Text的节点类型了。
常用的节点类型如下:
2.SAX解析:
package com.xml.parse;
import java.util.ArrayList;
import javax.xml.p