概述
DOM(Document Object Model)是java官方提供的一种解析xml方式。在解析xml文件时,会形成一个DOM树结构并全部装入内存。
优点:形成了树结构,直观好理解,代码易编写,在解析过程中树结构保留在内存中,方便修改
缺点: 当xml文件较大时,对内存耗费较大,容易影响解析性能并造成内存溢出
DOM解析常用的节点类型
示例
XML文件
book.xml
<?xml version="1.0" encoding="UTF-8"?>
<bookstroe>
<book id="1">
<name>java编程思想</name>
<author>Bruce Eckel</author>
<year>2015</year>
<price>79</price>
</book>
<book id="2">
<name>深入理解java虚拟机</name>
<author>周志明</author>
<price>40</price>
</book>
</bookstroe>
解析过程
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
public class DOMXMLTest {
/**
* @param args
* 使用DOM方式解析XML文件
* 步骤:
* 1.创建一个DocumentBuilderFactory的对象
* 2.创建一个DocumentBuilder对象
* 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 返回Document对象
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
//创建DocumentBuilderFactory对象
DocumentBuilderFactory dbf= DocumentBuilderFactory.newInstance();
try {
//创建DocumentBuilder对象
DocumentBuilder db=dbf.newDocumentBuilder();
//解析xml文件
Document document = db.parse("book.xml");
//获取book所有节点集合 返回一个节点列表
NodeList bookList=document.getElementsByTagName("book");
System.out.println("一共有"+bookList.getLength()+"本书");
//遍历每个book节点
for (int i = 0 ; i < bookList.getLength();i++) {
System.out.println("=========开始遍历第"+(i+1)+"本书=========");
//通过item( index ) 方法获取一个book节点 nodelist索引值从0开始
Node book=bookList.item(i);
//遍历book的属性
NamedNodeMap attrs=book.getAttributes();
System.out.println("第"+(i+1)+"本书共有"+attrs.getLength()+"个属性");
//遍历属性
for (int j=0; j < attrs.getLength(); j++) {
//通过item(index)方法获取一个属性
Node attr=attrs.item(j);
System.out.print("属性名"+attr.getNodeName());
System.out.println("--属性值:"+attr.getNodeValue());
}
// //如果一个节点有且只有一个属性时 将该节点强转为Element
// Element book=(Element) bookList.item(i);
// //通过getAttribute(String name)方法 依据属性名获取属性值
// String attrValue=book.getAttribute("id");
// System.out.println("id属性值为"+attrValue);
//遍历book节点的子结点
NodeList childNodes=book.getChildNodes();
//遍历childNodes获取每个节点的节点名和节点值
System.out.println("第"+(i+1)+"本书一共有"+childNodes.getLength()+"个子结点");
for(int k=0; k < childNodes.getLength(); k++){
//区分出text类型的node以及element类型的node
if(childNodes.item(k).getNodeType()==Node.ELEMENT_NODE){
//获取element类型的节点的节点名
System.out.print("第"+(k+1)+"个节点名"+childNodes.item(k).getNodeName());
//获取节点的节点值
// System.out.println("--节点值"+childNodes.item(k).getTextContent());
System.out.println("--节点值"+childNodes.item(k).getFirstChild().getNodeValue());
}
}
System.out.println("=========结束遍历第"+(i+1)+"本书=========");
}
} catch (ParserConfigurationException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}catch (SAXException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}