nutch2二次开发笔记
Nutch二次开发笔记,如何添加cookie,如何添加指定的url
1.Nutch介绍
Nutch 是一个开源Java 实现的爬虫框架和搜索引擎。有两个主版本1.x和2.x,它们的主要区别是1.x版本底层存储使用的是HDFS,2.x引入了Gora作为存储抽象层,从而支持各种NoSQL数据库,如HBase,Cassandra等,另外也支持mysql
2.Nutch安装问题
这里列出安装时候自身遇到的几个问题
原创
2017-08-02 17:11:16 ·
2079 阅读 ·
0 评论