dom4j解析XML

3 篇文章 0 订阅

1.使用dom4j解析xml

* dom4j,是一个组织,针对xml解析,提供解析器 dom4j


* dom4j不是javase的一部分,想要使用第一步需要怎么做?
*** 导入dom4j提供jar包
-- 创建一个文件夹 lib
-- 复制jar包到lib下面,
-- 右键点击jar包,build path -- add to build path
-- 看到jar包,变成奶瓶样子,表示导入成功

* 得到document
SAXReader reader = new SAXReader();
        Document document = reader.read(url);
* document的父接口是Node
* 如果在document里面找不到想要的方法,到Node里面去找


* document里面的方法 getRootElement() :获取根节点 返回的是Element


* Element也是一个接口,父接口是Node
- Element和Node里面方法
** getParent():获取父节点
** addElement:添加标签


* element(qname)
** 表示获取标签下面的第一个子标签
** qname:标签的名称
* elements(qname)
** 获取标签下面是这个名称的所有子标签(一层)
** qname:标签名称
* elements()

** 获取标签下面的所有一层子标签

1.1TestDom4j.java

package cn.itcast.dom4jtest;

import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

import cn.itcast.utils.Dom4jUtils;


public class TestDom4j {

	public static void main(String[] args) throws Exception {
//		selectName();
//		selectSin();
//		selectSecond();
//		addSex();
//		addAgeBefore();
//		modifyAge();
//		delSch();
		getValues();
	}
	
	//获取第一个p1里面的属性id1的值
	public static void getValues() throws Exception {
		/*
		 * 1、得到document
		 * 2、得到根节点
		 * 3、得到第一个p1元素
		 * 4、得到p1里面的属性值
		 * */
		//得到document
		Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
		//得到根节点
		Element root = document.getRootElement();
		//得到第一个p1元素
		Element p1 = root.element("p1");
		//得到p1里面的属性值
		String value = p1.attributeValue("id1");
		System.out.println(value);
	}
	
	//删除第一个p1下面的<school>ecit</school>元素
	public static void delSch() throws Exception {
		/*
		 * 1、得到document
		 * 2、得到根节点
		 * 3、得到第一个p1标签
		 * 4、得到第一个p1下面的school元素
		 * 5、删除(使用p1删除school)
		 * 
		 * 6、回写xml
		 * */
		//得到document    ctrl shift o 快速导包
		Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
		//得到根节点
		Element root = document.getRootElement();
		//得到第一个p1元素
		Element p1 = root.element("p1");
		//得到p1下面的school标签
		Element sch = p1.element("school");
		//删除school元素
		//通过父节点删除 
		//获取父节点的方法
		//sch.getParent(); //获取到school的父节点p1
		p1.remove(sch);
		//回写xml
		Dom4jUtils.xmlWriters(Dom4jUtils.PATH, document);
	}
	
	//修改第一个p1下面的age元素的值 <age>30</age>
	public static void modifyAge() throws Exception {
		/*
		 * 1、得到document
		 * 2、得到根节点,然后再得到第一个p1元素
		 * 3、得到第一个p1下面的age
		 * 4、修改值是 30
		 * 
		 * 5、回写xml
		 * 
		 * */
		//得到document
		Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
		//得到第一个根节点
		Element root = document.getRootElement();
		//得到第一个p1
		Element p1 = root.element("p1");
		//得到p1下面的age
		Element age = p1.element("age");
		//修改age的值
		age.setText("300");
		//回写xml
		Dom4jUtils.xmlWriters(Dom4jUtils.PATH, document);
	}
	
	//在第一个p1下面的age标签之前添加 <school>ecit.edu.cn</schlool>
	public static void addAgeBefore() throws Exception {
		/*
		 * 1、创建解析器
		 * 2、得到document
		 * 3、得到根节点
		 * 4、获取到第一个p1
		 * 
		 * 5、获取p1下面的所有的元素
		 * 		** elements()方法 返回 list集合
		 *      ** 使用list里面的方法,在特定位置添加元素
		 *      ** 创建元素 在元素下面创建文本
		 *      	*** add(int index, E element)
		 *      		- 第一个参数是 位置 下标,从0开始
		 *      		- 第二个参数是 要添加的元素
		 * 6、回写xml
		 * */
		//创建解析器
//		SAXReader saxReader = new SAXReader();
		//得到document
//		Document document = saxReader.read("src/p1.xml");
		
		Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
		//得到根节点
		Element root = document.getRootElement();
		//获取到第一个p1
		Element p1 = root.element("p1");
		//获取p1下面的所有元素
		List<Element> list = p1.elements();
		//创建元素 使用
		Element school = DocumentHelper.createElement("school");
		//在school下面创建文本
		school.setText("ecit");	
		//在特定位置添加
		list.add(1, school);
		//回写xml
		/*OutputFormat format = OutputFormat.createPrettyPrint();
		XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("src/p1.xml"), format);
		xmlWriter.write(document);
		xmlWriter.close();*/
		Dom4jUtils.xmlWriters(Dom4jUtils.PATH, document);
	}
	
	//在第一个p1标签末尾添加一个元素 <sex>nv</sex>
	public static void addSex() throws Exception {
		/*
		 * 1、创建解析器
		 * 2、得到document
		 * 3、得到根节点
		 * 
		 * 4、获取到第一个p1
		 * 5、在p1下面添加元素
		 * 6、在添加完成之后的元素下面添加文本
		 * 
		 * 7、回写xml
		 * */
		//创建解析器
//		SAXReader reader = new SAXReader();
		//得到document
//		Document document = reader.read("src/p1.xml");
		Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
		//得到根节点
		Element root = document.getRootElement();
		//得到第一个p1元素
		Element p1 = root.element("p1");
		//在p1下面直接添加元素
		Element sex1 = p1.addElement("sex");
		//在sex下面添加文本
		sex1.setText("nv");
		
		//回写xml
//		OutputFormat format = OutputFormat.createPrettyPrint(); //可以有缩进的效果
		OutputFormat format = OutputFormat.createCompactFormat();
//		XMLWriter  xmlWriter = new XMLWriter(new FileOutputStream("src/p1.xml"), format);
//		xmlWriter.write(document);
//		xmlWriter.close();
		Dom4jUtils.xmlWriters(Dom4jUtils.PATH, document);
	}
	
	//获取第二个name元素里面的值
	public static void selectSecond() throws Exception {	
		/*
		 * 1、创建解析器
		 * 2、得到document
		 * 3、得到根节点
		 * 
		 *  4、得到所有的p1
		 *  5、遍历得到第二个p1
		 *  6、得到第二个p1下面的name
		 *  7、得到name的值
		 * */
		//创建解析器
		SAXReader saxReader = new SAXReader();
		//得到document
		Document document = saxReader.read("src/p1.xml");
		//得到根节点
		Element root = document.getRootElement();
		//得到所有的p1
		List<Element> list = root.elements("p1");
		//得到第二个p1 list集合下标从0开始
		Element p2 = list.get(1);
		//得到p1下面的name
		Element name2 = p2.element("name");
		//得到name里面的值
		String s2 = name2.getText();
		System.out.println(s2);
	}
	
	//获取到一个name元素里面的值
	public static void selectSin() throws Exception {		
		/*
		 * 1、创建解析器
		 * 2、得到document
		 * 3、得到根节点
		 * 
		 * 4、得到第一个p1元素
		 * 5、得到p1下面的name元素
		 * 6、得到name元素里面的值
		 * */
		//创建解析器
		SAXReader saxReader = new SAXReader();
		//得到document
		Document document = saxReader.read("src/p1.xml");
		//得到根节点
		Element root = document.getRootElement();
		//得到第一个p1
		Element p1 = root.element("p1");
		//得到p1下面的name元素
		Element name1 = p1.element("name");
		//得到name的值
		String s1 = name1.getText();
		System.out.println(s1);
	}

	//查询xml中所有name元素的值
	public static void selectName() throws Exception {
		/*
		 * 1、创建解析器
		 * 2、得到document
		 * 3、得到根节点
		 * 
		 * 4、得到p1
		 * 5、得到p1下面的name
		 * 6、得到name里面的值
		 * */
		//创建解析器
		SAXReader saxReader = new SAXReader();
		//得到document
		Document document = saxReader.read("src/p1.xml");
		//得到根节点
		Element root = document.getRootElement();
		
		//得到p1
		List<Element> list = root.elements("p1");
		//遍历list
		for (Element element : list) {
			//element是每一个p1元素
			//得到p1下面的name元素
			Element name1 = element.element("name");
			//得到name里面的值
			String s = name1.getText();
			System.out.println(s);
		}
	}
}











1.2 TestDom4jXpath.java

package cn.itcast.dom4jtest;

import java.util.List;

import org.dom4j.Document;
import org.dom4j.Node;

import cn.itcast.utils.Dom4jUtils;

public class TestDom4jXpath {

	/**
	 * @param args
	 * @throws Exception 
	 */
	public static void main(String[] args) throws Exception {
//		test1();
		test2();

	}
	
	//使用xpath实现:获取第一个p1下面的name的值
	public static void test2() throws Exception {
		/*
		 * 1、得到document
		 * 2、直接使用selectSingleNode方法实现
		 * 	- xpath : //p1[@id1='aaaa']/name
		 * */
		//得到document
		Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
		//直接使用selectSingleNode方法实现
		Node name1 = document.selectSingleNode("//p1[@id1='aaaa']/name"); //name的元素
		//得到name里面的值
		String s1 = name1.getText();
		System.out.println(s1);
	}
	
	//查询xml中所有name元素的值
	public static void test1() throws Exception {
		/*
		 * 1、得到document
		 * 2、直接使用selectNodes("//name")方法得到所有的name元素
		 * 
		 * */
		//得到document
		Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
		//使用selectNodes("//name")方法得到所有的name元素
		List<Node> list = document.selectNodes("//name");
		//遍历list集合
		for (Node node : list) {
			//node是每一个name元素
			//得到name元素里面的值
			String s = node.getText();
			System.out.println(s);
		}
	}

}

1.3Dom4jUtils,java

package cn.itcast.utils;

import java.io.FileOutputStream;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;

public class Dom4jUtils {
	
	public static final String PATH = "src/p1.xml";

	//返回document
	public static Document getDocument(String path) {
		try {
			//创建解析器
			SAXReader reader = new SAXReader();
			//得到document
			Document document = reader.read(path);
			return document;
		} catch (Exception e) {
			e.printStackTrace();
		}
		return null;
	}
	
	//回写xml的方法
	public static void xmlWriters(String path,Document document) {
		try {
			OutputFormat format = OutputFormat.createPrettyPrint();
			XMLWriter xmlWriter = new XMLWriter(new FileOutputStream(path), format);
			xmlWriter.write(document);
			xmlWriter.close();
		}catch(Exception e) {
			e.printStackTrace();
		}
	}
}

1.4 p1.xml

<?xml version="1.0" encoding="UTF-8"?>

<person> 
  <p1 id1="aaaa"> 
    <name>zhangsan</name>  
    <age>300</age>  
    <sex>nv</sex> 
  </p1>  
  <p1> 
    <name>lisi</name>  
    <age>30</age> 
  </p1> 
</person>



2、使用dom4j查询xml

* 解析是从上到下解析
* 查询所有name元素里面的值
/*
1、创建解析器
2、得到document
3、得到根节点  getRootElement() 返回Element


4、得到所有的p1标签
* elements("p1") 返回list集合
* 遍历list得到每一个p1
5、得到name
* 在p1下面执行 element("name")方法 返回Element
6、得到name里面的值
* getText方法得到值
*/

* 查询第一个name元素的值
/*
* 1、创建解析器
* 2、得到document
* 3、得到根节点

* 4、得到第一个p1元素  
** element("p1")方法 返回Element
* 5、得到p1下面的name元素
** element("name")方法 返回Element
* 6、得到name元素里面的值
** getText方法
* */
* 获取第二个name元素的值
/*
* 1、创建解析器
* 2、得到document
* 3、得到根节点

*  4、得到所有的p1 
** 返回 list集合
*  5、遍历得到第二个p1
** 使用list下标得到 get方法,集合的下标从 0 开始,想要得到第二个值,下标写 1 
*  6、得到第二个p1下面的name
** element("name")方法 返回Element
*  7、得到name的值
** getText方法
* */

3、使用dom4j实现添加操作

* 在第一个p1标签末尾添加一个元素 <sex>nv</sex>
* 步骤
/*
* 1、创建解析器
* 2、得到document
* 3、得到根节点

* 4、获取到第一个p1
* 使用element方法
* 5、在p1下面添加元素
* 在p1上面直接使用 addElement("标签名称")方法 返回一个Element


* 6、在添加完成之后的元素下面添加文本
* 在sex上直接使用 setText("文本内容")方法
* 7、回写xml
* 格式化 OutputFormat,使用 createPrettyPrint方法,表示一个漂亮的格式
* 使用类XMLWriter 直接new 这个类 ,传递两个参数
*** 第一个参数是xml文件路径 new FileOutputStream("路径")
*** 第二个参数是格式化类的值
* */


4、使用dom4j实现在特定位置添加元素 

* 在第一个p1下面的age标签之前添加 <school>ecit.edu.cn</schlool>
* 步骤
   /*
* 1、创建解析器
* 2、得到document
* 3、得到根节点
* 4、获取到第一个p1

* 5、获取p1下面的所有的元素
* ** elements()方法 返回 list集合


*      ** 使用list里面的方法,在特定位置添加元素
* ** 首先创建元素 在元素下面创建文本
- 使用DocumentHelper类方法createElement创建标签
- 把文本添加到标签下面 使用 setText("文本内容")方法


*       *** list集合里面的 add(int index, E element)
*       - 第一个参数是 位置 下标,从0开始
*       - 第二个参数是 要添加的元素
* 6、回写xml
* */


** 可以对得到document的操作和 回写xml的操作,封装成方法
** 也可以把传递的文件路径,封装成一个常量
*** 好处:可以提高开发速度,可以提交代码可维护性
- 比如想要修改文件路径(名称),这个时候只需要修改常量的值就可以了,其他代码不需要做任何改变


5、使用dom4j实现修改节点的操作

* 修改第一个p1下面的age元素的值 <age>30</age>
* 步骤
/*
* 1、得到document
* 2、得到根节点,然后再得到第一个p1元素
* 3、得到第一个p1下面的age
element("")方法
* 4、修改值是 30
* * 使用setText("文本内容")方法
* 5、回写xml

* */


6、使用dom4j实现删除节点的操作

* 删除第一个p1下面的<school>ecit</school>元素
* 步骤
/*
* 1、得到document
* 2、得到根节点
* 3、得到第一个p1标签
* 4、得到第一个p1下面的school元素


* 5、删除(使用p1删除school)
* * 得到school的父节点
- 第一种直接得到p1
- 使用方法 getParent方法得到
* 删除操作
- 在p1上面执行remove方法删除节点
* 6、回写xml
* */


7、使用dom4j获取属性的操作

* 获取第一个p1里面的属性id1的值
* 步骤
/*
* 1、得到document
* 2、得到根节点
* 3、得到第一个p1元素
* 4、得到p1里面的属性值
- p1.attributeValue("id1");
- 在p1上面执行这个方法,里面的参数是属性名称
* */


8、使用dom4j支持xpath的操作

* 可以直接获取到某个元素 


* 第一种形式
/AAA/DDD/BBB: 表示一层一层的,AAA下面 DDD下面的BBB
* 第二种形式
//BBB: 表示和这个名称相同,表示只要名称是BBB,都得到
* 第三种形式
/*: 所有元素
* 第四种形式
** BBB[1]: 表示第一个BBB元素
×× BBB[last()]:表示最后一个BBB元素
* 第五种形式
** //BBB[@id]: 表示只要BBB元素上面有id属性,都得到
* 第六种形式
** //BBB[@id='b1'] 表示元素名称是BBB,在BBB上面有id属性,并且id的属性值是b1


9、使用dom4j支持xpath具体操作

** 默认的情况下,dom4j不支持xpath
** 如果想要在dom4j里面是有xpath
* 第一步需要,引入支持xpath的jar包,使用 jaxen-1.1-beta-6.jar
** 需要把jar包导入到项目中


** 在dom4j里面提供了两个方法,用来支持xpath
*** selectNodes("xpath表达式")
- 获取多个节点
*** selectSingleNode("xpath表达式")
- 获取一个节点


** 使用xpath实现:查询xml中所有name元素的值
** 所有name元素的xpath表示: //name
** 使用selectNodes("//name");
** 代码和步骤
/*
* 1、得到document
* 2、直接使用selectNodes("//name")方法得到所有的name元素

* */
//得到document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
//使用selectNodes("//name")方法得到所有的name元素
List<Node> list = document.selectNodes("//name");
//遍历list集合
for (Node node : list) {
//node是每一个name元素
//得到name元素里面的值
String s = node.getText();
System.out.println(s);
}

** 使用xpath实现:获取第一个p1下面的name的值
* //p1[@id1='aaaa']/name
* 使用到 selectSingleNode("//p1[@id1='aaaa']/name")
* 步骤和代码
/*
* 1、得到document
* 2、直接使用selectSingleNode方法实现
* - xpath : //p1[@id1='aaaa']/name
* */
//得到document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
//直接使用selectSingleNode方法实现
Node name1 = document.selectSingleNode("//p1[@id1='aaaa']/name"); //name的元素
//得到name里面的值
String s1 = name1.getText();
System.out.println(s1);
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值