[Code]Java - dom / dom4j 解析XML文件遇到的几个问题

最新推荐文章于 2022-11-18 16:59:44 发布

weixin_30343157

最新推荐文章于 2022-11-18 16:59:44 发布

阅读量160

点赞数

文章标签： java 人工智能数据库

原文链接：http://www.cnblogs.com/jimmyqwy/archive/2010/07/10/1774934.html

版权

最近稍微接触了下用Java Dom 解析XML的文件。

遇到两个小问题，就在这里做个笔记吧～

1. Node 的 getNodeValue方法返回的一直是null。

其实还是由于对这个类不熟悉的关系，导致了这个问题。

Node有很多类型，一般<html> </html> 这种类型叫做Element Node。

需要得到其中的文本，直接使用getNodeValue方法是行不通的。

因为此Node中包含的文本其实是属于另外一种Node类型，即 Text Node。

所以此文本对应的Node，是上述<html> Element Node的子节点。

解决方法：如同网上各处所说的

.getFirstChild().getNodeValue(); （第一个子节点的Value值）

至于为啥Element Node的Node Value是null值，

参照JavaDoc可知，其定义就是如此。详细参照如下：

http://download.oracle.com/docs/cd/E17476_01/javase/1.4.2/docs/api/org/w3c/dom/Node.html

2. XML保存问题

使用了很多方法，不是有异常，就是输出为空文件。

后来发现，还是有一些需要注意的地方。

先上代码：

File f = new File( save_filename );  // 需要保存的名字

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder;
try {
	builder = factory.newDocumentBuilder();
	// createing a new DOM-document...
	Document document = builder.newDocument();  // 1)
	
	Element saveRoot = document.createElement("Root");
	document.appendChild(saveRoot); // 2) 
	saveTree( saveRoot, document );   // 添加各种节点，建立DOM树

	// Use a Transformer for output
	TransformerFactory tFactory = TransformerFactory.newInstance();
	Transformer transformer = tFactory.newTransformer();
	transformer.setOutputProperty("indent", "yes");   // 3)

	// transform DOM 2 XML file  // 4) 
	DOMSource source = new DOMSource(document);
	StreamResult result = new StreamResult( f );
	transformer.transform(source, result);
	
} catch (ParserConfigurationException e) {
	e.printStackTrace();
}

其中使用到的

DocumentBuilderFactory / DocumentBuilder / TransformerFactory / DOMSource / StreamResult

意如其名，不用多解释了。

Question

1）全新 Document 的建立方式。

也可以使用读取时，建立的Document对象，只要更新相关的节点再保存即可。

此处为了练手，还是从头写了一遍。

2）document.appendChild 根节点

一开始词句忘记添加，所以导致输出空文本。

究其原因就是即使document.createElement后，也只是一个悬空节点，没有建立任何关系。

尤其是根节点，需要串联到document上。

3）此处即使使用了setOutputProperty("indent", "yes");

输出的文本文件，虽然节点之间有换行，

但是没有缩进，父节点和子节点的关系不是很明显。

解决方法：

在添加节点同时再添加一个上述的TextNode类型的子节点。

document.createTextNode("\n ");

（不知道还有没有其他更加好的办法。。。）

4）DOMSource的建立和transformer的执行需要放在document树建立完毕以后。

一开始以为document更新以后，transform一下就好了。

而DOMSource只是存放了一个document的reference。

看来顺序还是很重要的。。。

[补充]

3. 节点 Atrribute 的顺序问题

使用dom的Node方法getAttributes()固然很方便。

NamedNodeMap attrs = node.getAttributes();

但是返回的类型NamedNodeMap按照Attribute的名字，按字典序排序了。

如果各个Attribute相互之间的顺序不能改变的情况下，此方法就不能适用了。

（不知道dom里面还有其他方法，使得得到的Attribute属性并不是按照字母排序的。望高手指点）

代替方案：

只能使用了dom4j的API读取XML了。

用后发现，比dom还要方便，非常简洁。

e.g. ReadXML

只要四句话

SAXReader reader = new SAXReader();

File file = new File(xmlFileName);

try {

this.doc = reader.read(file); // read xml file

} catch (DocumentException e) {

e.printStackTrace();

}

this.root = this.doc.getRootElement(); // get root

SAXReader reader = new SAXReader();

File file = new File(xmlFileName);

Document doc = reader.read(file); // Get document

Element root = this.doc.getRootElement(); // get root

而Attribute的获取，也是按照固有xml的顺序，并没有按照字典序排序。

可使用Iterator遍历

for( Iterator<Attribute> It = element.attributeIterator(); It.hasNext(); ){

attribute = It.next();

// do something

}

.over.

先暂时写这些吧。不足之处望高手指点～^_^

才疏学浅。。。初级问题，不足挂齿。。。

转载于:https://www.cnblogs.com/jimmyqwy/archive/2010/07/10/1774934.html

weixin_30343157

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[Code]Java - dom / dom4j 解析XML文件遇到的几个问题

最近稍微接触了下用Java Dom 解析XML的文件。遇到两个小问题，就在这里做个笔记吧～1. Node 的 getNodeValue方法返回的一直是null。其实还是由于对这个类不熟悉的关系，导致了这个问题。Node有很多类型，一般<html> </html> 这种类型叫做Element Node。需要得到其中的文本，直接使用getNodeVal...
复制链接

扫一扫