最好用dom4j解析xml文件

最新推荐文章于 2022-06-12 16:37:31 发布

孙行者悟空

最新推荐文章于 2022-06-12 16:37:31 发布

阅读量771

点赞数

分类专栏： dom4j 文章标签： xml 文档遍历递归 iterator

本文链接：https://blog.csdn.net/jj88888/article/details/17580593

版权

dom4j 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

这是一个Dom4j解析XML的例子，为做复杂递归处理前期所写的例子。涵盖了XML的解析方面大部分核心API。

环境：

Dom4j-1.6.1

Dom4j解析需要XML需要的最小类库为：

dom4j-1.6.1.jar

jaxen-1.1-beta-6.jar

目标：

解析一个xml，输出所有的属性和元素值。

测试代码：

XML文件：

<? xml version ="1.0" encoding ="GBK" ?>
< doc >
 < person id ="1" sex ="m" >
 < name >zhangsan </ name >
 < age >32 </ age >
 < adds >
 < add code ="home" >home add </ add >
 < add code ="com" >com add </ add >
 </ adds >
 </ person >
 < person id ="2" sex ="w" >
 < name >lisi </ name >
 < age >22 </ age >
 < adds >
 < add ID ="22" id ="23" code ="home" >home add </ add >
 < add ID ="23" id ="22" code ="com" >com add </ add >
 < add id ="24" code ="com" >com add </ add >
 </ adds >
 </ person >
</ doc >

解析代码：

package com.topsoft.test;

import org.dom4j.io.SAXReader;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.Node;

import java.util.Iterator;
import java.util.List;
import java.io.InputStream;

/**
* Created by IntelliJ IDEA. 
* User: leizhimin 
* Date: 2008-3-26 15:53:51 
* Note: Dom4j遍历解析XML测试
*/
public class TestDom4j {
 /**
 * 获取指定xml文档的Document对象,xml文件必须在classpath中可以找到
 *
 * @param xmlFilePath xml文件路径
 * @return Document对象
 */
 public static Document parse2Document(String xmlFilePath) {
 SAXReader reader = new SAXReader();
 Document document = null;
 try {
 InputStream in = TestDom4j. class.getResourceAsStream(xmlFilePath);
 document = reader.read(in);
 } catch (DocumentException e) {
 System.out.println(e.getMessage());
 System.out.println( "读取classpath下xmlFileName文件发生异常，请检查CLASSPATH和文件名是否存在！");
 e.printStackTrace();
 }
 return document;
 }

 public static void testParseXMLData(String xmlFileName) {
 //产生一个解析器对象
 SAXReader reader = new SAXReader();
 //将xml文档转换为Document的对象
 Document document = parse2Document(xmlFileName);
 //获取文档的根元素
 Element root = document.getRootElement();
 //定义个保存输出xml数据的缓冲字符串对象
 StringBuffer sb = new StringBuffer();
 sb.append( "通过Dom4j解析XML,并输出数据:\n");
 sb.append(xmlFileName + "\n");
 sb.append( "----------------遍历start----------------\n");
 //遍历当前元素(在此是根元素)的子元素
 for (Iterator i_pe = root.elementIterator(); i_pe.hasNext();) {
 Element e_pe = (Element) i_pe.next();
 //获取当前元素的名字
 String person = e_pe.getName();
 //获取当前元素的id和sex属性的值并分别赋给id,sex变量
 String id = e_pe.attributeValue( "id");
 String sex = e_pe.attributeValue( "sex");
 String name = e_pe.element( "name").getText();
 String age = e_pe.element( "age").getText();
 //将数据存放到缓冲区字符串对象中
 sb.append(person + ":\n");
 sb.append( "\tid=" + id + " sex=" + sex + "\n");
 sb.append( "\t" + "name=" + name + " age=" + age + "\n");

 //获取当前元素e_pe(在此是person元素)下的子元素adds
 Element e_adds = e_pe.element( "adds");
 sb.append( "\t" + e_adds.getName() + "\n");

 //遍历当前元素e_adds(在此是adds元素)的子元素
 for (Iterator i_adds = e_adds.elementIterator(); i_adds.hasNext();) {
 Element e_add = (Element) i_adds.next();
 String code = e_add.attributeValue( "code");
 String add = e_add.getTextTrim();
 sb.append( "\t\t" + e_add.getName() + ":" + " code=" + code + " value=\"" + add + "\"\n");
 }
 sb.append( "\n");
 }
 sb.append( "-----------------遍历end-----------------\n");
 System.out.println(sb.toString());

 System.out.println( "---------通过XPath获取一个元素----------");
 Node node1 = document.selectSingleNode( "/doc/person");
 System.out.println( "输出节点:" +
 "\t"+node1.asXML());

 Node node2 = document.selectSingleNode( "/doc/person/@sex");
 System.out.println( "输出节点:" +
 "\t"+node2.asXML());

 Node node3 = document.selectSingleNode( "/doc/person[name=\"zhangsan\"]/age");
 System.out.println( "输出节点:" +
 "\t"+node3.asXML());

 System.out.println( "\n---------XPath获取List节点测试------------");
 List list = document.selectNodes( "/doc/person[name=\"zhangsan\"]/adds/add");
 for(Iterator it=list.iterator();it.hasNext();){
 Node nodex=(Node)it.next();
 System.out.println(nodex.asXML());
 }

 System.out.println( "\n---------通过ID获取元素的测试----------");
 System.out.println( "陷阱：通过ID获取，元素ID属性名必须为“大写ID”，小写的“id”会认为是普通属性！");
 String id22 = document.elementByID( "22").asXML();
 String id23 = document.elementByID( "23").asXML();
 String id24 = null;
 if (document.elementByID( "24") != null) {
 id24 = document.elementByID( "24").asXML();
 } else {
 id24 = "null";
 }

 System.out.println( "id22= " + id22);
 System.out.println( "id23= " + id23);
 System.out.println( "id24= " + id24);
 }

 public static void main(String args[]) {
 testParseXMLData( "/person.xml");
 }
}

运行结果：

通过Dom4j解析XML,并输出数据:
/person.xml
----------------遍历start----------------
person:
 id=1 sex=m
 name=zhangsan age=32
 adds
 add: code=home value="home add"
 add: code=com value="com add"

person:
 id=2 sex=w
 name=lisi age=22
 adds
 add: code=home value="home add"
 add: code=com value="com add"
 add: code=com value="com add"

-----------------遍历end-----------------

---------通过XPath获取一个元素----------
输出节点: < person id ="1" sex ="m" >
 < name >zhangsan </ name >
 < age >32 </ age >
 < adds >
 < add code ="home" >home add </ add >
 < add code ="com" >com add </ add >
 </ adds >
 </ person >
输出节点: sex="m"
输出节点: < age >32 </ age >

---------XPath获取List节点测试------------
< add code ="home" >home add </ add >
< add code ="com" >com add </ add >

---------通过ID获取元素的测试----------
陷阱：通过ID获取，元素ID属性名必须为“大写ID”，小写的“id”会认为是普通属性！
id22= < add ID ="22" id ="23" code ="home" >home add </ add >
id23= < add ID ="23" id ="22" code ="com" >com add </ add >
id24= null

Process finished with exit code 0