老师要求把XML格式的文件里的节点信息提取出来,输出成CSV格式的文件。
由于一直不善用JAVA,因此原定用C++实现,但是网上搜了下,用C++操作XML的话,没有内置库,只能自己下载API,而比较流行的API是MSXML和tinyXML,看了下这两个库的sample,感觉可用性一般,特别是tinyXML,简直和javascript操作xml的方式如出一辙,因此尝试用JAVA实现这个小功能,反正和项目无关,无伤大局,不过有时候确实得承认,在WEB数据处理方面,JAVA在人性化上确实比C++要高一个档次。
网上搜了一些JAVA DOM编程方面的示例代码,套路基本都一样,都是利用DocumentBuilder去操作,然后利用循环挨个提取节点。但是发现代码有些冗余,特别是循环部分,每一级的节点处理实际都是重复代码。因此想到了不如用递归法来实现这个功能,原因如下:
1. 从根节点开始,开始向下一级一级访问,每个节点在处理的时候,流程都是这样的:当无子节点的时候直接输出节点value,当有子节点的时候,继续往下访问。
2. 当访问节点的时候,会先判断节点是不是null,当是null的时候,则停止向下访问,因此递归跳出条件就是:节点不为空。
实现的代码如下:
public void printNode(Node n){
for(Node node=n;node!=null;node=node.getNextSibling()){
if(node.hasChildNodes()){
printNode(node.getFirstChild());
}
else{
System.out.print(node.getNodeValue());
}
}
}
一共9行代码,简单明了,可读性高于循环法。