![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Nutch
昨日不可追
技术人生、终身学习、投资创业|明日不可待,昨日不可追!
展开
-
Nutch学习——插件机制一
Nutch插件机制——特点概括 可扩展: 通过对已有接口的实现,nutch框架允许定制插件以扩展它的功能。比如,HTMParser 插件(用来解析Html 文档) 就是Parse Interface的一个实现。 灵活: 我们可以有选择的使用插件,或者开发自己的插件。在使用时,你可以有选择性的删除一些插件或者加载一些插件。 可维护: 不用担心你开发的插件对原创 2014-11-08 23:36:19 · 1011 阅读 · 1 评论 -
Nutch学习——读源码 Crawl.java
我们的命令是: bin/nutch crawl url -dir data 最先进入 Crawl.java ------main方法: /* Perform complete crawling and indexing (to Solr) given a set of root urls and the -solr parameter respectivel原创 2014-11-11 16:04:57 · 1222 阅读 · 0 评论 -
Nutch学习——读源码 Injector.java
Nutch 源码 Injector.java 解析原创 2014-11-11 18:12:09 · 1015 阅读 · 0 评论