java解析任意xml_java利用dom4j对任意xml的解析

最近完成了java对任意对象生成xml,有写了下java对任意一个xml文件的解析,生成主要靠反射原理来完成,而解析则主要是遍历xml树的每个节点,并对每个节点进行处理。刚刚开始我写了个如下的解析文件。

package javaForXML;

import java.io.File;

import java.util.ArrayList;

import java.util.HashMap;

import java.util.Iterator;

import java.util.List;

import java.util.Map;

import org.dom4j.Attribute;

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.Element;

import org.dom4j.io.SAXReader;

/**

* 利用dom4j进行XML解析

* 没用递归,本类只能解析到两层嵌套的属性和值

* @date Dec 25, 20094:43:47 PM

* @author zhangjp

* @param

*/

public class PraseXMLTest5 {

/**

* 遍历每个节点和属性

* @param filename

* @returnPraseXMLTest5.java

*/

public  static  List> iterateWholeXML(String filename) {

List >list = new ArrayList>();

SAXReader saxReader = new SAXReader();

try {

Document document = saxReader.read(new File(filename));

Element root = document.getRootElement();

// 遍历根结点的所有孩子节点

for (Iterator iter = root.elementIterator(); iter.hasNext();) {

HashMap map = new HashMap();

Element element = (Element) iter.next();

if (element == null)

continue;

// 获取属性和它的值

for (Iterator attrs = element.attributeIterator(); attrs.hasNext();) {

Attribute attr = (Attribute) attrs.next();

if (attr == null)

continue;

String attrName = attr.getName();

String attrValue = attr.getValue();

map.put(attrName, attrValue);

}

if(element.isTextOnly()){

String elementName = element.getName();

String elementValue = element.getText();

map.put(elementName, elementValue);

}else{

// 遍历结点的所有孩子节点,并进行处理

for (Iterator iterInner = element.elementIterator(); iterInner.hasNext();) {

Element elementInner = (Element) iterInner.next();

//如果没有孩子结点,则直接取值

if (elementInner == null){

String elementName = element.getName();

String elementValue = element.getText();

map.put(elementName, elementValue);

}

//孩子结点的属性

for(Iterator innerAttrs = elementInner.attributeIterator();innerAttrs.hasNext();){

Attribute innerAttr = (Attribute)innerAttrs.next();

if(innerAttr == null)

continue;

String innerAttrName = innerAttr.getName();

String innerAttrValue = innerAttr.getValue();

map.put(innerAttrName, innerAttrValue);

}

//假定没有第三层嵌套,获得第二层的值

String innerName = elementInner.getName();

String innerValue = elementInner.getText();

map.put(innerName, innerValue);

}

}

list.add(map);

}

return list;

} catch (DocumentException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

return null;

}

/**

* 测试

* @param args

* @throws DocumentExceptionPraseXMLTest5.java

*/

public static void main(String[] args) throws DocumentException {

String filename = "d:\\data.xml";

List> list = PraseXMLTest5.iterateWholeXML(filename);

for(Map map:list){

for (String ss : map.keySet()) {

System.out.println(ss + ":" + map.get(ss));

}

}

}

}

这个写的很累,具体说很累赘,而且只能遍历xml的两层嵌套,对三层或更多的嵌套无能无力。于是很明显的看到这里用一个递归式多么容易的事情。于是写了下面这个代码:

package javaForXML;

import java.io.File;

import java.util.ArrayList;

import java.util.HashMap;

import java.util.Iterator;

import java.util.List;

import java.util.Map;

import org.dom4j.Attribute;

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.Element;

import org.dom4j.io.SAXReader;

/**

* 利用dom4j进行XML解析

* 利用递归,本类对所有嵌套进行递归遍历

* @date Dec 25, 20094:43:47 PM

* @author zhangjp

* @param

*/

public class PraseXMLTest6 {

/**

* 遍历每个节点和属性

* @param filename

* @returnPraseXMLTest5.java

*/

public  static  List> iterateWholeXML(String filename) {

List >list = new ArrayList>();

SAXReader saxReader = new SAXReader();

try {

Document document = saxReader.read(new File(filename));

Element root = document.getRootElement();

recursiveNode(root,list);

return list;

} catch (DocumentException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

return null;

}

/**

* 递归遍历所有的节点获得对应的值

* @param rootPraseXMLTest6.java

*/

private static void recursiveNode(Element root,List >list ){

// 遍历根结点的所有孩子节点

for (Iterator iter = root.elementIterator(); iter.hasNext();) {

HashMap map = new HashMap();

Element element = (Element) iter.next();

if (element == null)

continue;

// 获取属性和它的值

for (Iterator attrs = element.attributeIterator(); attrs.hasNext();) {

Attribute attr = (Attribute) attrs.next();

if (attr == null)

continue;

String attrName = attr.getName();

String attrValue = attr.getValue();

map.put(attrName, attrValue);

}

//如果有PCDATA,则直接提出

if(element.isTextOnly()){

String innerName = element.getName();

String innerValue = element.getText();

map.put(innerName, innerValue);

list.add(map);

}else{

list.add(map);

//递归调用

recursiveNode(element ,list);

}

}

}

/**

* 测试

* @param args

* @throws DocumentExceptionPraseXMLTest5.java

*/

public static void main(String[] args) throws DocumentException {

String filename = "d:\\zhang.xml";

List> list = PraseXMLTest6.iterateWholeXML(filename);

for(Map map:list){

for (String ss : map.keySet()) {

System.out.println(ss + ":" + map.get(ss));

}

}

}

}

用了递归后,节省很多代码。看起来也比较简单明了,最大的好处是对于任意多个嵌套的xml文件的解析都不在话下。

以上解析构造Document的时候都是文件,而在实际使用中很多情况不是来自文件,而是来自一个String,那么需要DocumentHelper这个类,如以下处理方法:

Document document=DocumentHelper.parseText(xml);

Element root = document.getRootElement();

呵呵 ~ 好了 ,这个解析比生成要简单的多,好好悟吧。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值