Dom是一种跨语言的,操作标签语言的标准
Dom解析xml的方式为:根据整个文档生成一个Dom的树形结构
优点:使用灵活,在各种语言中差别不大,
缺点:使用复杂,在解析大型文档的时候,效率不高
步骤:
1.获取DocumentBuilder的工厂
2.获取DocumentBuilder
3.创建文档对象
4.解析各节点和节点的子节点
使用的类(已经包含在Java标准类库中)
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
具体实现:
//1.创建一个文档工厂对象
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
//2.从工厂中得到文档创建器
DocumentBuilder db = dbf.newDocumentBuilder();
//3.从文档创建器中获得一个文档对象
Document document = db.parse("src/xml/employee.xml");
//4.获取文档中的所有节点的列表
NodeList doc = document.getChildNodes();
//5.循环遍历子节点
Node employees = doc.item(0); //employees
NodeList employeelist = employees.getChildNodes();
System.out.println("==========" + employeelist.getLength());
for (int i = 0; i < employeelist.getLength(); i++) {
Node current = employeelist.item(i);
//过滤无效节点
if("#text".equals(current.getNodeName())){continue;}
NodeList employeeinfo = current.getChildNodes();
for (int j = 0; j < employeeinfo.getLength(); j++) {
Node info = employeeinfo.item(j);
//过滤无效节点
if("#text".equals(info.getNodeName())){continue;}
System.out.print(info.getNodeName() + ": " + info.getChildNodes().item(0).getNodeValue());
//取值
System.out.print(" ");
}
System.out.println();
}
一些又有的知识点
Node节点的类型
Text类型 -- 文本类型,标签对之间的文本属于text类型
Comment类型 -- 注释类型
Element类型 -- 标签对,又一个Node
DOcumentTypeDefine-- 对应DTD
Dom中使用short类型的常量来表示这些类型
public static final short ATTRIBUTE_NODE 2
public static final short COMMENT_NODE 8
public static final short DOCUMENT_FRAGMENT_NODE 11
public static final short DOCUMENT_NODE 9
public static final short DOCUMENT_TYPE_NODE 10
public static final short ELEMENT_NODE 1
public static final short ENTITY_NODE 6
public static final short ENTITY_REFERENCE_NODE 5
public static final short NOTATION_NODE 12
public static final short PROCESSING_INSTRUCTION_NODE 7
public static final short TEXT_NODE 3
获取节点类型的方法 node.getNodeType();