Nutch 2.2.1+MySQL+Solr4.2实现网站内容的抓取和索引
在local目录下创建 search。把apache-nutch-2.2.1-src.tar.gz 上传到search 目录中 解压,然后再数据库中执行以下sql。
手动创建数据库nutch和数据表webpage,其中webpage的表结构如下:
CREATE TABLE `webpage` (
`id` varchar(767) CHARACTER SET latin1 NOT NUL
原创
2017-08-22 15:57:15 ·
1512 阅读 ·
0 评论