JAVA 使用Dom4j 解析XML

解析XML的方式有很多,本文介绍使用dom4j解析xml。

1、环境准备

(1)下载dom4j-1.6.1.jar

(2)下载junit-4.10.jar

2、温馨提示

解析XML过程是通过获取Document对象,然后继续获取各个节点以及属性等操作,因此获取Document对象是第一步,大体说来,有三种方式:

(1)自己创建Document对象

Document document = DocumentHelper.createDocument();
		Element root = document.addElement("students");
其中students是根节点,可以继续添加其他节点等操作。

(2)读取XML文件获取Document对象

//创建SAXReader对象
		SAXReader reader = new SAXReader();
		//读取文件 转换成Document
		Document document = reader.read(new File("XXXX.xml"));
(3)读取XML文本内容获取Document对象

String xmlStr = "<students>......</students>";
		Document document = DocumentHelper.parseText(xmlStr);
3、示例

(1)xml文件内容如下

<?xml version="1.0" encoding="UTF-8"?>
<students>
	<student1 id="001">
		<微信公众号>@残缺的孤独</微信公众号>
		<学号>20140101</学号>
		<地址>北京海淀区</地址>
		<座右铭>要么强大,要么听话</座右铭>
	</student1>
	<student2 id="002">
		<新浪微博>@残缺的孤独</新浪微博>
		<学号>20140102</学号>
		<地址>北京朝阳区</地址>
		<座右铭>在哭泣中学会坚强</座右铭>
	</student2>
</students>
(2)解析过程
package cn.com.yy.dom4j;

import java.io.File;
import java.util.Iterator;
import java.util.List;

import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import org.junit.Test;

public class Dom4JforXML {
	
	@Test
	public void test() throws Exception{
		//创建SAXReader对象
		SAXReader reader = new SAXReader();
		//读取文件 转换成Document
		Document document = reader.read(new File("src/cn/com/yy/dom4j/s.xml"));
		//获取根节点元素对象
		Element root = document.getRootElement();
		//遍历
		listNodes(root);
	}
	
	//遍历当前节点下的所有节点
	public void listNodes(Element node){
		System.out.println("当前节点的名称:" + node.getName());
		//首先获取当前节点的所有属性节点
		List<Attribute> list = node.attributes();
		//遍历属性节点
		for(Attribute attribute : list){
			System.out.println("属性"+attribute.getName() +":" + attribute.getValue());
		}
		//如果当前节点内容不为空,则输出
		if(!(node.getTextTrim().equals(""))){
			 System.out.println( node.getName() + ":" + node.getText());  
		}
		//同时迭代当前节点下面的所有子节点
		//使用递归
		Iterator<Element> iterator = node.elementIterator();
		while(iterator.hasNext()){
			Element e = iterator.next();
			listNodes(e);
		}
	}
}
(3)解析结果
当前节点的名称:students
当前节点的名称:student1
属性id:001
当前节点的名称:微信公众号
微信公众号:@残缺的孤独
当前节点的名称:学号
学号:20140101
当前节点的名称:地址
地址:北京海淀区
当前节点的名称:座右铭
座右铭:要么强大,要么听话
当前节点的名称:student2
属性id:002
当前节点的名称:新浪微博
新浪微博:@残缺的孤独
当前节点的名称:学号
学号:20140102
当前节点的名称:地址
地址:北京朝阳区
当前节点的名称:座右铭
座右铭:在哭泣中学会坚强
4、dom4j操作节点属性

使用dom4j可以操作节点属性,比如添加节点属性、删除节点属性、修改属性值等操作。下面使用dom4j为上述的student1节点删除id属性,新添name属性。

(1)代码示例

@Test
	public void test2()throws Exception{
		//创建SAXReader对象
		SAXReader reader = new SAXReader();
		//读取文件 转换成Document
		Document document = reader.read(new File("src/cn/com/yy/dom4j/s.xml"));
		//获取根节点元素对象
		Element root = document.getRootElement();
		
		System.out.println("-------添加属性前------");
		//获取节点student1
		Element student1Element = root.element("student1");
		//遍历
		listNodes(student1Element);
		//获取其属性
		Attribute idAttribute = student1Element.attribute("id");
		//删除其属性
		student1Element.remove(idAttribute);
		//为其添加新属性
		student1Element.addAttribute("name", "这是student1节点的新属性");
		System.out.println("-------添加属性后------");
		listNodes(student1Element);
	}
(2)结果
-------添加属性前------
当前节点的名称:student1
<span style="background-color: rgb(255, 0, 0);">属性id:001</span>
当前节点的名称:微信公众号
微信公众号:@残缺的孤独
当前节点的名称:学号
学号:20140101
当前节点的名称:地址
地址:北京海淀区
当前节点的名称:座右铭
座右铭:要么强大,要么听话
-------添加属性后------
当前节点的名称:student1
<span style="background-color: rgb(255, 255, 255);"><span style="color:#ff0000;">属性name:这是student1节点的新属性
</span></span>当前节点的名称:微信公众号
微信公众号:@残缺的孤独
当前节点的名称:学号
学号:20140101
当前节点的名称:地址
地址:北京海淀区
当前节点的名称:座右铭
座右铭:要么强大,要么听话
5、dom4j新增节点

使用dom4j可以删除指定节点、新增节点等操作,我们使用dom4j为student1节点新增phone节点,如下。

(1)代码

//添加节点
	@Test
	public void test3()throws Exception{
		//创建SAXReader对象
		SAXReader reader = new SAXReader();
		//读取文件 转换成Document
		Document document = reader.read(new File("src/cn/com/yy/dom4j/s.xml"));
		//获取根节点元素对象
		Element root = document.getRootElement();
		System.out.println("-------添加节点前------");
		//获取节点student1
		Element student1Element = root.element("student1");
		//遍历
		listNodes(student1Element);
		//添加phone节点
		Element phoneElement = student1Element.addElement("phone");
		//为phone节点设置值
		phoneElement.setText("137xxxxxxxx");
		System.out.println("-------添加节点后------");
		listNodes(student1Element);
	}
(2)结果
-------添加节点前------
当前节点的名称:student1
属性id:001
当前节点的名称:微信公众号
微信公众号:@残缺的孤独
当前节点的名称:学号
学号:20140101
当前节点的名称:地址
地址:北京海淀区
当前节点的名称:座右铭
座右铭:要么强大,要么听话
-------添加节点后------
当前节点的名称:student1
属性id:001
当前节点的名称:微信公众号
微信公众号:@残缺的孤独
当前节点的名称:学号
学号:20140101
当前节点的名称:地址
地址:北京海淀区
当前节点的名称:座右铭
座右铭:要么强大,要么听话
当前节点的名称:phone
<span style="color:#ff0000;">phone:137xxxxxxxx</span>
6、把Document对象写入新的文件

有时,我们需要把document对象写入新的文件,dom4j提供了对应的API以便我们进行操作。我们在完成第 5 后,把document写入新的文件s1.xml,如下。

(1)代码

//添加节点后,写入新的文件
	@Test
	public void test4()throws Exception{
		//创建SAXReader对象
		SAXReader reader = new SAXReader();
		//读取文件 转换成Document
		Document document = reader.read(new File("src/cn/com/yy/dom4j/s.xml"));
		//获取根节点元素对象
		Element root = document.getRootElement();
		System.out.println("-------添加节点前------");
		//获取节点student1
		Element student1Element = root.element("student1");
		//遍历
		listNodes(student1Element);
		//添加phone节点
		Element phoneElement = student1Element.addElement("phone");
		//为phone节点设置值
		phoneElement.setText("137xxxxxxxx");
		System.out.println("-------添加节点后------");
		listNodes(student1Element);
		//把student1Element写入新文件
		writerDocumentToNewFile(document);
		System.out.println("---写入完毕----");
	}
	
	//document写入新的文件
	public void writerDocumentToNewFile(Document document)throws Exception{
		//输出格式
		OutputFormat format = OutputFormat.createPrettyPrint();
		//设置编码
		format.setEncoding("UTF-8");
		//XMLWriter 指定输出文件以及格式
		XMLWriter writer = new XMLWriter(new OutputStreamWriter(new FileOutputStream(new File("src/cn/com/yy/dom4j/s1.xml")),"UTF-8"), format);
		
		//写入新文件
		writer.write(document);
		writer.flush();
		writer.close();
	}
(2)查看s1.xml文件
<?xml version="1.0" encoding="UTF-8"?>

<students> 
  <student1 id="001"> 
    <微信公众号>@残缺的孤独</微信公众号>  
    <学号>20140101</学号>  
    <地址>北京海淀区</地址>  
    <座右铭>要么强大,要么听话</座右铭>  
    <phone>137xxxxxxxx</phone>
  </student1>  
  <student2 id="002"> 
    <新浪微博>@残缺的孤独</新浪微博>  
    <学号>20140102</学号>  
    <地址>北京朝阳区</地址>  
    <座右铭>在哭泣中学会坚强</座右铭> 
  </student2> 
</students>
因为涉及到中文,所以在输出时要设定UTF8编码,OutputStreamWriter进行设置编码。

还有输出格式的问题,在此处使用的是OutputFormat.createPrettyPrint(),输出文档时进行了排版格式化。还有一种是OutputFormat.createCompactFormat()方法,输出内容是一行,没有进行格式化,是紧凑型的输出。如下:

<?xml version="1.0" encoding="UTF-8"?>
<students><student1 id="001"><微信公众号>@残缺的孤独</微信公众号><学号>20140101</学号><地址>北京海淀区</地址><座右铭>要么强大,要么听话</座右铭><phone>137xxxxxxxx</phone></student1><student2 id="002"><新浪微博>@残缺的孤独</新浪微博><学号>20140102</学号><地址>北京朝阳区</地址><座右铭>在哭泣中学会坚强</座右铭></student2></students>

最后,为大家附上源代码。 java dom4j解析xml



  • 49
    点赞
  • 174
    收藏
    觉得还不错? 一键收藏
  • 13
    评论
### 回答1: 使用dom4j解析xml文件可以通过以下步骤完成: 1. 加载xml文件,可以使用以下代码: ``` DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = factory.newDocumentBuilder(); Document doc = builder.parse(new File("file.xml")); ``` 2. 获取根节点,使用以下代码: ``` Element root = doc.getRootElement(); ``` 3. 遍历子节点,使用以下代码: ``` List<Element> childList = root.elements(); for (Element child : childList) { //对子节点进行操作 } ``` 4. 获取节点属性,使用以下代码: ``` String attributeValue = element.attributeValue("attributeName"); ``` 5. 获取节点值,使用以下代码: ``` String value = element.getText(); ``` ### 回答2: Java是一种流行的编程语言,在处理XML文件时,有很多的库可供选择。dom4j则是其中的一种库,它是一种同步、线程安全的XML解析器,拥有高效、灵活、简单的API。 dom4j解析XML文件分为以下步骤: 1. 创建SAXReader对象,它是dom4j解析器的核心类。 2. 调用SAXReader对象的read()方法,通过文件输入流读取XML文件内容并将其转换成一个Document对象。 3. 从Document对象中取到根元素(root element)。 4. 从根元素开始递归遍历所有子元素,获取特定元素的值或属性,修改元素的值或属性。 下面对以上步骤进行详细说明: 1. 创建SAXReader对象 SAXReader对象是dom4j解析器的核心对象,要解析XML文件,需要先创建该对象。创建SAXReader对象的代码如下: SAXReader reader = new SAXReader(); 2. 解析XML文件 要解析XML文件,需要调用SAXReader对象的read()方法,并传入要解析XML文件名或者文件输入流。代码示例如下: Document document = reader.read(new File("test.xml")); 3. 获取根元素 解析完成后,需要获取XML文件的根元素(即文档的最外层标签)。获取根元素的代码如下: Element root = document.getRootElement(); 4. 遍历所有子元素 获取根元素之后,可以通过遍历所有子元素来获取需要的元素、属性或者修改元素内容。遍历子元素的代码如下: List<Element> elements = root.elements(); for(Element element : elements) { // 对元素进行处理 } dom4j除了上述基本步骤外,还提供了更多的API和工具类,方便我们在XML文件处理过程中进行元素的增删改查、元素内容的验证和转换等操作。总的来说,dom4j是一种易用、灵活的XML解析器,广泛应用于Java开发领域。 ### 回答3: DOM4JJava语言中的一种XML文档操作工具包,它可以方便地对XML文档进行创建、读取、修改、查询及输出等操作。使用DOM4J解析XML文件可以方便地从XML文件中读取数据、进行数据处理,并将处理的数据保存到指定的文件或数据源中。 在使用DOM4J解析XML文件时,我们首先需要通过文档工厂类创建DOM4J的文档对象,然后就可以通过该文档对象获取XML文档的根节点,并对其进行遍历操作。 在遍历XML文档时,我们可以通过getElement()方法获取指定节点的子节点或属性节点,并通过getText()方法获取节点中的文本内容。同样地,我们也可以使用XPath表达式来获取指定节点的数据。 除了读取XML文件,我们还可以使用DOM4J创建和修改XML文件。在创建XML文件时,我们可以通过创建根节点和子节点来构建整个XML文档,并使用输出流将其保存到指定位置。在修改XML文件时,我们可以通过获取指定节点并修改其内容来对XML文档进行更新。 总的来说,DOM4J是一种强大的XML文档操作工具包,它不仅提供了丰富的API函数,还支持XPath表达式和XSLT样式表,使得我们可以方便地对XML文档进行操作和处理。通过学习DOM4J,我们可以更好地掌握Java语言中XML文档的读取、创建和修改等技术,从而更好地开发出高质量的Java应用程序。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值