DOM是用与平台和语言无关的方式表示XML文档的官方W3C标准。DOM解析的时候,会将XML文件加载到内存中形成一种类似树的结构。解析前需要加载整个XML文件,这也是DOM方式的缺点。
DOM解析XML步骤:
1. 创建一个DocumentBuilderFactory的对象
2. 创建一个DocumentBuilder的对象
3. 通过DocumentBuilder的parse方法加载xml文件到当前项目下
4. 获取所有的指定节点的集合
5. 遍历节点
看例子:
public class DomTest {
public static void main(String[] args) {
//1、创建一个DocumentBuilderFactory的对象
DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();
try {
//2、创建一个DocumentBuilder的对象
DocumentBuilder db = dbf.newDocumentBuilder();
//3、通过DocumentBuilder的parse方法加载books.xml文件到当前项目下
Document document = db.parse("books.xml");
//4、获取所有的book节点的集合
NodeList booklist = document.getElementsByTagName("book");
//通过booklist的getLength()方法可以获取booklist的长度
System.out.println("一共有"+booklist.getLength()+"本书");
//5、遍历每一个book节点
for (int i = 0; i < booklist.getLength(); i++) {
System.out.println("------------------下面开始遍历第"+(i+1)+"本书的内容--------------");
//通过item(i) 获取一个book节点,nodelist的索引值从0开始
Node book=booklist.item(i);
//获取book节点所有属性的集合
NamedNodeMap attrs = book.getAttributes();
//遍历book的属性
System.out.println("第"+(i+1)+"本书共有"+attrs.getLength()+"个属性");
for (int j = 0; j < attrs.getLength(); j++) {
//通过item(i) 获取book节点的某一个属性
Node attr = attrs.item(j);
//获取属性名
System.out.print("属性名:"+attr.getNodeName());
//获取属性值
System.out.println("--属性值:"+attr.getNodeValue());
}
// //前提:已经知道book节点有且只能有1个id属性
// //将book节点进行强制类型装换,转换为Element类型
// Element book = (Element) booklist.item(i);
// String attrValue = book.getAttribute("id");
// System.out.println("id属性的属性值为:"+attrValue);
//解析book节点的子节点
NodeList chileNodes = book.getChildNodes();
//遍历childNodes获取每个节点的节点名和节点值
System.out.println("第"+(i+1)+"本书共有"+chileNodes.getLength()+"个子节点");
for (int j = 0; j < chileNodes.getLength(); j++) {
//区分出text类型的node以及element类型的node
if(chileNodes.item(j).getNodeType() == Node.ELEMENT_NODE ){
//获取Element类型节点的节点名
System.out.print("第"+(j+1)+"个节点的节点名:"+chileNodes.item(j).getNodeName());
//获取Element类型节点的节点值
System.out.println("--节点值是:"+chileNodes.item(j).getFirstChild().getNodeValue());
// System.out.println("--节点值是:"+chileNodes.item(j).getTextContent());
}
}
System.out.println("-------------------结束遍历第"+(i+1)+"本书的内容---------------");
}
} catch (ParserConfigurationException e) {
e.printStackTrace();
}catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
需要解析的目标XML文件:
<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
<book id="1">
<name>Java程序设计</name>
<author>刘三</author>
<year>2016</year>
<price>95</price>
</book>
<book id="2">
<name>C++ language Programing</name>
<year>2004</year>
<price>46</price>
<language>English</language>
</book>
</bookstore>
解析结果:
涨姿势环节:
DOM解析优点:
1、在XML文件解析的同时可以进行修改,这方便了新的XML生成。
2、由于加载了整个XML文件,读取比较灵活
缺点:
也正是由于加载了整个XML文件,解析速度慢,消耗资源多。