使用Dom解析XML

最新推荐文章于 2024-05-10 10:50:15 发布

小米周哥哥

最新推荐文章于 2024-05-10 10:50:15 发布

阅读量64

点赞数

分类专栏： JavaSe 文章标签： XML J#

JavaSe 专栏收录该内容

20 篇文章 0 订阅

订阅专栏

Dom是一种跨语言的,操作标签语言的标准

Dom解析xml的方式为:根据整个文档生成一个Dom的树形结构

优点:使用灵活,在各种语言中差别不大,
缺点:使用复杂,在解析大型文档的时候,效率不高

步骤:
1.获取DocumentBuilder的工厂
2.获取DocumentBuilder
3.创建文档对象
4.解析各节点和节点的子节点

使用的类(已经包含在Java标准类库中)

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

具体实现:

//1.创建一个文档工厂对象
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

//2.从工厂中得到文档创建器
DocumentBuilder db = dbf.newDocumentBuilder();

//3.从文档创建器中获得一个文档对象
Document document = db.parse("src/xml/employee.xml");

//4.获取文档中的所有节点的列表
NodeList doc = document.getChildNodes();

  //5.循环遍历子节点
Node employees = doc.item(0); //employees
NodeList employeelist = employees.getChildNodes();
System.out.println("==========" + employeelist.getLength());
for (int i = 0; i < employeelist.getLength(); i++) {
 Node current = employeelist.item(i);
 //过滤无效节点
 if("#text".equals(current.getNodeName())){continue;}
 NodeList employeeinfo = current.getChildNodes();
    
 for (int j = 0; j < employeeinfo.getLength(); j++) {
 Node info = employeeinfo.item(j);
 //过滤无效节点
 if("#text".equals(info.getNodeName())){continue;}
 System.out.print(info.getNodeName() + ": " + info.getChildNodes().item(0).getNodeValue());
 //取值
 System.out.print(" ");
}
System.out.println();
}

一些又有的知识点

Node节点的类型
Text类型 -- 文本类型,标签对之间的文本属于text类型
Comment类型 -- 注释类型
Element类型 -- 标签对,又一个Node
DOcumentTypeDefine-- 对应DTD

Dom中使用short类型的常量来表示这些类型

public static final short ATTRIBUTE_NODE 2 
 public static final short COMMENT_NODE 8 
 public static final short DOCUMENT_FRAGMENT_NODE 11 
 public static final short DOCUMENT_NODE 9 
 public static final short DOCUMENT_TYPE_NODE 10 
 public static final short ELEMENT_NODE 1 
 public static final short ENTITY_NODE 6 
 public static final short ENTITY_REFERENCE_NODE 5 
 public static final short NOTATION_NODE 12 
 public static final short PROCESSING_INSTRUCTION_NODE 7 
 public static final short TEXT_NODE 3

获取节点类型的方法 node.getNodeType();