import org.htmlparser.NodeFilter;
import org.htmlparser.Parser;
import org.htmlparser.filters.NodeClassFilter;
import org.htmlparser.tags.LinkTag;
import org.htmlparser.util.NodeList;
public class spider {
public static void main(String args[])
{
try{
NodeFilter filter=new NodeClassFilter(LinkTag.class);
Parser parser=new Parser();
parser.setURL("http://www.baidu.com");
parser.setEncoding(parser.getEncoding());
NodeList list=parser.extractAllNodesThatMatch(filter);
for(int i=0;i<list.size();i++)
{
LinkTag node=(LinkTag)list.elementAt(i);
System.out.println("testLinkTag() Link is "+node.extractLink());
}
}catch(Exception e)
{
e.printStackTrace();
}
}
}
HtmlParser filter
最新推荐文章于 2016-08-24 20:52:17 发布