最近在帮别人写解析xml,百度了很多,自己也总结了一下
关于解析xml,这篇博客有很详细的介绍,四种方法解析xml:http://www.cnblogs.com/Qian123/p/5231303.html
下面是自己总结的Dom方式解析xml
项目结构:
先来一个xml文件:
<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
<book name="书本1" id="1">
<name>
<name1>大话数据结构</name1>
<name2>大话数据库</name1>
<name3>设计模式</name1>
</name>
<year>2019</year>
<price>77</price>
<language>中文</language>
</book>
<book name="书本2" id="2">
<name>kvm</name>
<year>2019</year>
<price>66</price>
<language>英文</language>
</book>
<book name="书本3" id="3">
<name>数据库</name>
<year>2019年</year>
<price>16</price>
<language>中文</language>
</book>
<book name="书本4" id="4">
<name>Java大全</name>
<year>1986年</year>
<price>88</price>
<language>最流行编程之一</language>
</book>
</bookstore>
第一个<name>里有嵌套,也可以自行去掉,都可以解析成功
节点中的属性name和id也都可以删去,不影响解析
然后上代码:
package dom;
import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.IOException;
public class DOMTest {
public static void main(String[] args) {
//1、创建一个DocumentBuilderFactory的对象
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
//2、创建一个DocumentBuilder的对象
try {
DocumentBuilder db = dbf.newDocumentBuilder();
//通过DocumentBuilder对象的parser方法加载books.xml文件到当前项目下
Document document = db.parse("src/dom/books.xml"); //doucument对象接受Parse的返回值
//获取XML文件所有节点的集合。
NodeList List1 = document.getElementsByTagName("book");
//遍历每一个节点信息
System.out.println("一共有"+List1.getLength()+"本书");
for(int i=0;i<List1.getLength();i++) {
System.out.println("=================下面开始遍历第" + (i + 1) + "个节点的内容=================");
//通过item(i)方法 获取一个List节点,nodelist的索引值从0开始
Node one = List1.item(i);
//获取当前节点的所有属性
NamedNodeMap attrs =one.getAttributes();
System.out.println("第"+(i+1)+"本书" + "共有"+attrs.getLength()+"个属性");
//遍历book属性
for(int j=0;j<attrs.getLength();j++) {
//通过item(index)方法获取one节点的某一个属性
Node attr = attrs.item(j);
//获取属性名
System.out.print("属性名:"+attr.getNodeName());
//获取属性值
System.out.println("属性值:"+attr.getNodeValue());
}
//解析当前节点的子节点
NodeList childNodes = one.getChildNodes();
//遍历childNodes获取每个节点的节点名和节点值
System.out.println("第" + (i+1) + "个节点共有" + (childNodes.getLength()-1)/2 + "个子节点");
for (int k = 0; k < childNodes.getLength(); k++) {
//区分text类型的node以及element类型的node,去除text
if (childNodes.item(k).getNodeType()==Node.ELEMENT_NODE) {
//获取了element类型的节点名
System.out.print("第"+(k+1)/2+"个子节点的节点名: "+childNodes.item(k).getNodeName());
//获取了element类型节点的节点值
//System.out.println("--节点值是:"+childNodes.item(k).getFirstChild().getNodeValue());
System.out.println("--节点值是:"+childNodes.item(k).getTextContent());
}
}
System.out.println("=================结束遍历第" + (i + 1) + "个节点的内容=================");
}
}catch (ParserConfigurationException e){ //捕获不同的异常
e.printStackTrace();
}catch (SAXException e) {
e.printStackTrace();
}catch (IOException e){
e.printStackTrace();
}
}
}
运行结果:
一共有4本书
=================下面开始遍历第1个节点的内容=================
第1本书共有2个属性
属性名:id属性值:1
属性名:name属性值:书本1
第1个节点共有4个子节点
第1个子节点的节点名: name--节点值是:
大话数据结构
大话数据库
设计模式
第2个子节点的节点名: year--节点值是:2019
第3个子节点的节点名: price--节点值是:77
第4个子节点的节点名: language--节点值是:中文
=================结束遍历第1个节点的内容=================
=================下面开始遍历第2个节点的内容=================
第2本书共有2个属性
属性名:id属性值:2
属性名:name属性值:书本2
第2个节点共有4个子节点
第1个子节点的节点名: name--节点值是:kvm
第2个子节点的节点名: year--节点值是:2019
第3个子节点的节点名: price--节点值是:66
第4个子节点的节点名: language--节点值是:英文
=================结束遍历第2个节点的内容=================
=================下面开始遍历第3个节点的内容=================
第3本书共有2个属性
属性名:id属性值:3
属性名:name属性值:书本3
第3个节点共有4个子节点
第1个子节点的节点名: name--节点值是:数据库
第2个子节点的节点名: year--节点值是:2019年
第3个子节点的节点名: price--节点值是:16
第4个子节点的节点名: language--节点值是:中文
=================结束遍历第3个节点的内容=================
=================下面开始遍历第4个节点的内容=================
第4本书共有2个属性
属性名:id属性值:4
属性名:name属性值:书本4
第4个节点共有4个子节点
第1个子节点的节点名: name--节点值是:Java大全
第2个子节点的节点名: year--节点值是:1986年
第3个子节点的节点名: price--节点值是:88
第4个子节点的节点名: language--节点值是:最流行编程之一
=================结束遍历第4个节点的内容=================Process finished with exit code 0