解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用 DOM 接口来操作这个树结构。
优点:整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能;
缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间;使用场合:一旦解析了文档还需多次访问这些数据;硬件资源充足(内存、CPU)。
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
public class DOMtest {
public static void main(String[] args) {
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
try {
DocumentBuilder bf = dbf.newDocumentBuilder();
Document doc;
doc = bf.parse("books.xml");
NodeList book_list = doc.getElementsByTagName("book");
System.out.println("BookStore有" + book_list.getLength() + "本书(元素)\n");
for(int i=0; i<book_list.getLength(); i++) {
Node book = book_list.item(i);
NamedNodeMap attr_list = book.getAttributes();
for(int k=0; k<attr_list.getLength(); k++){
System.out.println("\n第" + (i+1) +"本书的属性:" + attr_list.item(k));
}
NodeList ch_list = book.getChildNodes();
System.out.println("第" + (i+1) +"本书有"+ ch_list.getLength()+"个子节点");
for(int j=0; j<ch_list.getLength(); j++) {
if(ch_list.item(j).getNodeType() == Node.ELEMENT_NODE)
System.out.println(ch_list.item(j).getNodeName() + ": " +
ch_list.item(j).getFirstChild().getNodeValue().trim());
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
}