Nutch + Solr + Hadoop 搭建分布式搜索引擎详细教程

Nutch + Solr + Hadoop 搭建分布式搜索引擎详细文档
经过几天的摸索,终于完全成功地把环境搭建好了,这个过程遇到各种问题,并且目前网上没有一个完全可行的详细环境搭建教程,所以这里专门写一个详细的文档作为记录,这里主要记录nutch 的配置。


环境:Linux 3.14.2 x86_64, JDK 1.7.0.51 x86_64

准备:  hadoop 2.4.1 , 

          apache-nutch-2.2.1-src.tar.gz (http://www.apache.org/dyn/closer.cgi/nutch/2.2.1/apache-nutch-2.2.1-src.tar.gz), 

          solr-4.10.2.tgz(http://apache.petsads.us/lucene/solr/4.10.2), 

          apache-tomcat-6.0.43.tar.gz(http://tomcat.apache.org/download-60.cgi#6.0.43),

          apache-ant-1.9.4-bin.zip(http://www.webhostingjams.com/mirror/apache//ant/binaries/apache-ant-1.9.4-bin.zip)

          IK Analyzer 2012FF_hf1(IK Analyzer 2012FF_hf1http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip

先安装好JDK, Hadoop,配置好环境变量,可以参考网上教程,这里不写了。保证java 和 Hadoop 环境没有问题, 接下来就先安装Solr:
首先要安装tomcat,解压apache-tomcat-6.0.43.tar.gz到一个目录下,这样就可以了,如果需要可以修改相应的配置,默认配置可以的。

解压solr-4.10.2.tgz 到一个目录下,将dist目录下的solr-4.10.2.war拷贝到TOMCAT_HOME/webapps 下,更名为solr.war。接着配置solr.home (基于JNDI的方式),将example 目录下的solr文件夹拷贝到自己想放置solr.home的目录下(我的是solrhome目录)。在apache-tomcat-6.0.43/conf/Catalina/localhost 目录(如果这个目录不存在,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值