之前已经配置好nutch1.6的相关信息,这时候到官网上下载solr3.6.
nutch以前版本有war可以直接进行界面化的搜索,1.5之后没有了,用solr进行处理来进行查询。
解压之后:
1. 把apache-nutch-1.6/conf/schema.xml文件拷贝到apache-solr-3.6.2\example\solr\conf目录下覆盖掉原来的schema.xml
2. 修改solrconfig.xml文件找到<str name="df">id</str>改为content,可能会有文章说修改为text,因为之前版本是text作为df的,这个不修改后面会出现错误,修改为text在搜索的时候会出现问题。稍后会提到。
3. 建立索引到solr
bin/nutch solrindex http://127.0.0.1:8983/solr/ crawl/crawldb -linkdb crawl/linkdb crawl/segments/*
4.启动solr,进入到apache-solr-3.6.2\example目录,使用java –jar start.jar命令启动
5.访问http://127.0.0.1:8983/solr/admin
直接进行query:
上面如果不把id改为content而改为text这里就只能*:*这种情况才会有结果,输入其他信息没有查询结果。