nutch2.3.1+solr4.x创建搜索引擎心得01

  1. 在CDH下安装的solr,要使用solrctl创建Core 生成位置:/var/lib/solr
  2. 个人用户没有root权限,不能在公有目录下创建文件夹。该问题出现在创建Core的过程中
  3. 复制nutch/conf/schema 到Core的conf目录下
  4. nutch2.3.1和solr不是覆盖schema.xml就能使用,和1.x版本不同,需要在nutch-site中添加indexer-solr插件!
  5. 完成1,3,4。执行crawl seed crawlID solrCore 1 命令,直接将抓取的数据放入solr中
    crawl 执行nutch脚本
    seed 种子文件
    crawlID 存放的数据库
    solrCore solr地址下的Core 例:http://localhost:8983/solr/a1 a1为已创建的Core

参考:
如何在CDH中使用Solr对HDFS中的JSON数据建立全文索引https://cloud.tencent.com/developer/article/1158299

CDH-5.14安装solr
https://blog.csdn.net/seashouwang/article/details/80886981

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值