XML的解析简介:
先来做个对比,HTML是标记性语言,js通过dom解析HTML时,根据HTML的层级结构,在内存中分配了一个实行结构,把HTML的标签文本等都封装成了对象进行操作,那么同为标记性文档的XML也使用了同样的原理
XML的解析技术:dom 和 sax
下面图片解释
对应的树形结构为
dom 解析与 sax解析的对比
解析XML文件的前提是,必须要有解析器
主要有下面三个
- sun公司(已被Oracle公司收购)提供的 jaxp (需要了解,是标准)
- dom4j组织提供的 dom4j (实际开发中用的最多)
- jdom组织提供的 jdom (基本不用)
注意:下面这三个是解析器,解析技术只有上面的两种
jaxp介绍:
* jaxp是JavaSe的一部分
* java提供了四个类分别针对dom和sax解析
dom:
DocumentBuilderFactory:解析器工厂
- 它是一个抽象类,不能new,但是可以通过其提供的newInstance()方法实例化
DocumentBuilder:解析器类
- 它也是一个抽象类,不能new,但是可以通过DocumentBuilderFactory.newDocumentBuilder()获取实例
- 其提供的parse(“XML文件路径”)方法可以得到整个Document文档
- 返回的Document是Node的子类,所以可以使用Node提供的方法
sax:
SAXParserFactory:解析器工厂
SAXParser:解析器类
几个示例
用到的XML源代码
<?xml version="1.0" encoding="UTF-8" standalone="no"?><person>
<p1>
<name>zhangsan</name>
<age>23</age>
</p1>
<p1>
<name>LiSi</name>
<age>15</age>
</p1>
</person>
(1)查询name节点
public class FindName {
public static void main(String[] args) throws Exception {
searchAll();
}
//查询所有name
private static void searchAll() throws Exception {
//创建解析器工厂
DocumentBuilderFactory buiderFactory = DocumentBuilderFactory.newInstance();
//创建解析器
DocumentBuilder builder = buiderFactory.newDocumentBuilder();
//解析xml返回document
Document document = builder.parse("src/Demo1.xml");
//得到所有的name对象
NodeList nodes = document.getElementsByTagName("name");
//遍历
for(int i=0;i<nodes.getLength();i++){
System.out.println(nodes.item(i).getTextContent());
}
}
}
(2)向p1中添加sex属性
private static void addNode() throws Exception {
DocumentBuilderFactory buiderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = buiderFactory.newDocumentBuilder();
Document document = builder.parse("src/Demo1.xml");
// 得到p1集合
NodeList p1s = document.getElementsByTagName("p1");
// 创建sex
Element sex1 = document.createElement("sex");
// 创建文本
Text text1 = document.createTextNode("女");
// 将文本添加到sex1
sex1.appendChild(text1);
// 将sex1添加到第一个p1中
p1s.item(0).appendChild(sex1);
// 以上所有操作都是针对内存,所以要回写xml
TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
transformer.transform(new DOMSource(document), new StreamResult("src/Demo1.xml"));
}
(3)修改sex属性
private static void modifySex() throws Exception {
DocumentBuilderFactory buildeFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = buildeFactory.newDocumentBuilder();
Document document = builder.parse("src/Demo1.xml");
// 得到sex,修改内容
Node sex = document.getElementsByTagName("sex").item(0);
sex.setTextContent("男");
// 回写的xml
TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
transformer.transform(new DOMSource(document), new StreamResult("src/Demo1.xml"));
}
(4)遍历所有节点
private static void ergodic() throws Exception{
DocumentBuilderFactory buiderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = buiderFactory.newDocumentBuilder();
Document document = builder.parse("src/Demo1.xml");
list(document);
}
//遍历的递归实现
private static void list(Node node) {
if(node.getNodeType() == Node.ELEMENT_NODE){
System.out.println(node.getNodeName());
}
//得到一层子节点
NodeList list = node.getChildNodes();
//遍历list
for(int i=0;i<list.getLength();i++){
Node node1 =list.item(i);
list(node1);
}
}
以上方法都是在主函数中直接调用即可,XML文件放在了src下