htmlparser
tomfish88
这个作者很懒,什么都没留下…
展开
-
htmlparser对html页面处理的算法
主要是如下几种方式 采用Visitor方式访问Html try { Parser parser = new Parser(); parser.setURL(”http://www.google.com”); parser.setEncoding(parser.getEncoding()); NodeVisitor visitor = new ...2011-06-30 11:30:35 · 146 阅读 · 0 评论 -
HTMLParser 过滤Filter
HTMLParser遍历了网页的内容以后,以树(森林)结构保存了结果。HTMLParser访问结果内容的方法有两种。使用Filter和使用Visitor。(一)Filter类顾名思义,Filter就是对于结果进行过滤,取 得需要的内容。HTMLParser在org.htmlparser.filters 包之内一共定义了16个不同的Filter,也可以分为几类。判断类Filter:TagNameFi...2011-06-30 11:50:50 · 131 阅读 · 0 评论 -
html抓取网页链接的例子
package function.htmlparser; import org.htmlparser.Node; import org.htmlparser.NodeFilter; import org.htmlparser.Parser; import org.htmlparser.filters.AndFilter; import org.htmlparser.filters.H...2011-06-30 14:24:25 · 140 阅读 · 0 评论