用HTMLParser解析网页时,有一部分网页节点无法解析

今天在用HTMLParser解析学校团委的网页时发现一个问题,无法解析我所需的节点,经过几次尝试后依然不行。这令我很困惑,在反复查看了节点过滤设置后也没发现什么问题。这令我万分不解,于是我把整张网页的所有节点都打印了出来,发现只得到部分节点还有不少节点没有解析出来,而我需要的节点正是在无法解析的节点中。在查了百度之后没有在网上发现相关的资料,特发此文,希望有达人可以解惑!!!

 

PS:

      网址:http://www.tw.tzc.edu.cn/

 

      解析代码:

try {
		 Parser parser = new Parser("http://www.tw.tzc.edu.cn");
		 parser.setEncoding("gb2312");
		 NodeIterator it = parser.elements();
		 while (it.hasMoreNodes()) {
		 System.out.println(it.nextNode());
		 }
		 } catch (ParserException e) {
		 // TODO Auto-generated catch block
		 e.printStackTrace();
		 }

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值