Java解析、读取XML文件并存入TXT文件的简单例子
XML文件的来源是通过集搜客在淘宝上爬取的客户评论信息,供同学作简单的文本聚类用。选取的是女装评论,因为考虑到女生对于服装的理解会比男生更加深刻、阅历更加丰富。XML文件的具体内容构造非常简单,如下图:
XML文件的内容获取是采用DOM结点实现方法,XML文件的格式是类似于HTML的格式,DOM结点比较明显。获取item结点里的两个子节点中的内容,写入TXT文本,是本次学习的目的。关键语句为:
doc.getElementsByTagName("item").item(i).getFirstChild().getNodeValue();
使用Document返回一个包含文本的对象doc,用NodeList存放item结点的数据,返回nl对象,并用nl对象的长度作为遍历循环次数的阈值,来对每个item结点进行读取和转存。
另外还有其他三种方法我认为比较好的放在这里与大家分享,希望有所帮助,分别是:
1. DOM4j实现方法
2. JDOM实现方法
3. SAX实现方法
转自:java读取xml文件的四种方法
本次学习的目的是为了应同学的变态要求,将每个评论者的评论信息放在一个TXT文件里,所以需要用到File的构造方法和创建新文件的方法。
本次学习使用的是BufferWriter来写入文本,需要注意的是使用到了BufferWriter实例化对象bw的flush方法,为的是尽快的将缓冲区的数据“推入”目标文件,虽然bw的close方法最后也会处理,但是我的初衷是为了让数据不丢失,close仅用于关闭写入流。另外还有PrintWriter和FileWriter两个方法,具体例子也贴出来,转自&