[2013.12.25]
由于Nutch 2.x不会自己索引了,所以需要solr项目来配合。
先前用过solor4.x之前的版本,界面啥的看着就功能很少,于是现在选择4.5.1版本。先前还用过nutch1.7想与solor 4.5.1配合,生不如死。
不过这次nutch 2.2.1与solor 4.5.1配合得很顺利,过程如下:
下载 http://nlp.solutions.asia/wp-content/uploads/2012/08/schema.xml 并覆盖solor目录下的/example/solr/collection1/conf/schema.xml
然后启动solr
cd ${APACHE_SOLR_HOME}/example
java -jar start.jar
nutch需要重新索引一下:
bin/nutch solrindex http://127.0.0.1:8983/solr/ -reindex
很快就能在solr中搜索到内容了!