今天在用HTMLParser解析学校团委的网页时发现一个问题,无法解析我所需的节点,经过几次尝试后依然不行。这令我很困惑,在反复查看了节点过滤设置后也没发现什么问题。这令我万分不解,于是我把整张网页的所有节点都打印了出来,发现只得到部分节点还有不少节点没有解析出来,而我需要的节点正是在无法解析的节点中。在查了百度之后没有在网上发现相关的资料,特发此文,希望有达人可以解惑!!!
PS:
解析代码:
try {
Parser parser = new Parser("http://www.tw.tzc.edu.cn");
parser.setEncoding("gb2312");
NodeIterator it = parser.elements();
while (it.hasMoreNodes()) {
System.out.println(it.nextNode());
}
} catch (ParserException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}