Java解析、读取XML文件并存入TXT文件的简单例子

Java解析、读取XML文件并存入TXT文件的简单例子

XML文件的来源是通过集搜客在淘宝上爬取的客户评论信息,供同学作简单的文本聚类用。选取的是女装评论,因为考虑到女生对于服装的理解会比男生更加深刻、阅历更加丰富。XML文件的具体内容构造非常简单,如下图:
xml文件的构造

XML文件的内容获取是采用DOM结点实现方法,XML文件的格式是类似于HTML的格式,DOM结点比较明显。获取item结点里的两个子节点中的内容,写入TXT文本,是本次学习的目的。关键语句为:

doc.getElementsByTagName("item").item(i).getFirstChild().getNodeValue();

使用Document返回一个包含文本的对象doc,用NodeList存放item结点的数据,返回nl对象,并用nl对象的长度作为遍历循环次数的阈值,来对每个item结点进行读取和转存。
另外还有其他三种方法我认为比较好的放在这里与大家分享,希望有所帮助,分别是:
1. DOM4j实现方法
2. JDOM实现方法
3. SAX实现方法
转自:java读取xml文件的四种方法
本次学习的目的是为了应同学的变态要求,将每个评论者的评论信息放在一个TXT文件里,所以需要用到File的构造方法和创建新文件的方法。
本次学习使用的是BufferWriter来写入文本,需要注意的是使用到了BufferWriter实例化对象bw的flush方法,为的是尽快的将缓冲区的数据“推入”目标文件,虽然bw的close方法最后也会处理,但是我的初衷是为了让数据不丢失,close仅用于关闭写入流。另外还有PrintWriter和FileWriter两个方法,具体例子也贴出来,转自&

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值