无聊的时候写了一个小程序,只是简单的用了一下htmlparser的功能,可以拿来测试一下网站的某个页面锚点数,即链接。
用到了htmlparser类库,下载地址是:点击下载
package com.bling.parser;
import org.htmlparser.Parser;
import org.htmlparser.Tag;
import org.htmlparser.util.ParserException;
import org.htmlparser.visitors.NodeVisitor;
public class BaiduParser {
public static void main(String[] args) {
try {
Parser parser = new Parser();
parser.setURL("http://www.baidu.com");
parser.setEncoding(parser.getEncoding());
NodeVisitor visitor = new NodeVisitor(){
@Override
public void visitTag(Tag tag){
if(tag.getTagName().equals("A")){
System.out.println(tag.getFirstChild());
System.out.println(tag.getAttribute("href"));
}
}
};
parser.visitAllNodesWith(visitor);
} catch (ParserException e) {
e.printStackTrace();
}
}
}
note:测试别的网站只是需要修改一下
parser.setURL("http://www.baidu.com");
里面的这个网址就行。