nutch+solor+elcipse安装配置

参考文档:utch搜索引擎(第4期)_ Eclipse开发配置(http://www.cnblogs.com/xia520pi/p/3695617.html

由于参考文档成文于2014年,时隔近5年过去,软件版本发生了巨大的变化,现根据新版本进行开发。另外,针对以上文件有改正,在此致谢。

1、环境准备

1.1、文件夹目录结构

c:\soengine\

    |----cygwin
    |----NutchWorkPlat
    |----ant
    |----solr
    |----nutch
        |----eclipse
        |----tomcat
        |----workspace

(实际上我使用的是一台服务器作为开发设备,该服务器只有一个c盘,大家都知道,c盘下面各种文件夹都有比较杂乱,因此我新建立了一个文件夹作为根目录)

1.2、本次nutch二次开发所需要的软件版本:

【新建系统变量】

ANT_HOME= E:\NutchWorkPlat\ant

【增加】

PATH=……;%ANT_HOME%\bin; %ANT_HOME%\lib
操作系统:Windows server 2008 r2 standard
ANT版本:apache-ant-1.10.5-bin.tar.gz
JDK版本:jre-8u191-windows-x64.exe(jre1.8.0_181)
Solr版本:solr-7.5.0.zip
Nutch版本:apache-nutch-1.15-bin.tar.gz
Tomcat版本:apache-tomcat-9.0.13.tar.gz
Eclipse版本:4.7(之所以使用4.7是因为已经安装了很长时间了,不想变了。)

(注:现在Nutch分为两个版本:1.x和2.x,这两个版本的主要区别在于底层的存储不同。1.x版本是基于Hadoop架构的,底层存储使用的是分布式文件系统HDFS,而2.x通过使用ApacheGora,使得Nutch可以访问HBase、Cassandra、MySQL、DataFileAvroStore、AvroStore等等,我们这里使用的是hdfs,因此使用的是1.x版本)

下面是安装的Eclipse插件:

IvyDE插件:
Ivy:
    plugins:
        org.apache.ivy_2.5.0.cr1_20180412005306.jar
        org.apache.ivy.eclipse.ant_2.5.0.cr1_20180412005306.jar
    features:
        org.apache.ivy.feature_2.5.0.cr1_20180412005306.jar
IvyDE:
    plugins:
        org.apache.ivyde.eclipse_2.2.0.final-201311091524-RELEASE.jar
    features:
        org.apache.ivyde.feature_2.2.0.final-201311091524-RELEASE.jar

Tomcat插件:
        以前安装的。忘记版本了。

Ant和Ivy可以说是相当古老的开发工具组合,一个编译,一个外部jar管理,现在Maven已经逐步取代Ant+Ivy。Ivy最多由eclipse继承到4版本之前,4之后的版本都已近逐步取消内置Ivy插件了,所以要独立安装。

之所以有plugins和features,是因为该jar包分别拷贝到eclipse下对应的plugins和features目录下面。features目录下方的都是插件的配置信息,启动信息还有一些图片等一些资源,而plugins目录下则方的是jar包,也就是实现插件功能的代码包,还有一些必要的配置信息等。

1.3 JDK安装配置

具体为什么要配置环境变量(就是命令行操作的时候快呗),怎么配置的这里就不写了,百度上一堆,下面是配置:

【新建系统变量】

JAVA_HOME=C:\Program Files\Java\jre1.8.0_181

CLASSPATH=.;%JAVA_HOME%\lib;% JAVA_HOME%\jre\lib

NUTCH_JAVA_HOME=%JAVA_HOME%

【在系统变量Path中增加】

PATH=……;%JAVA_HOME%\bin; %JAVA_HOME%\jre\bin

1.4ant安装配置

把"apache-ant-1.10.5-bin.tar.gz"解压到"E:\NutchWorkPlat"中,并重新命名为"ant"。


【新建系统变量】

ANT_HOME= C:\soengine\NutchWorkPlat\ant

【在系统变量Path中增加】

PATH=……;%ANT_HOME%\bin; %ANT_HOME%\lib

1.5 Ivy和IvyDE安装配置(参考文档:eclipse安装Ivy插件

参考文档的关于ivy的安装配置在eclipse 4.7安装版上面不可行。

在线安装的方法也不可行,官网给出的在线安装地址也不可用,提示conten.xml无法访问,我查看了下,里面确实没这个文件,却有另外一个文件。但是不支持eclipse。

需要额外说明的是,解压版(免安装版)的eclipse的features和plugins目录就在程序目录下,而安装版的eclipse的features和plugins则是在用户根目录下的\.p2\pool目录中,但是,这两个目录下面eclipse自己带的插件实在太多,复制进去太危险。

所做工作如下:

1、在Ivy网站Ivyde网站分别下载以下文件:

apache-ivy-2.5.0-rc1-bin-with-deps.zip(注意是带依赖版本)

apache-ivyde-2.2.0.final-201311091524-RELEASE.zip

2、在eclipse安装文件夹下创建custom文件夹,custom目录下创建Ivy和Ivyde文件夹,在ivy问夹下创建plugins文件夹

3、在eclipse\dropins文件夹里面创建两个文件:Ivy.link和Ivyde.link,这两个文件内容分别为:

path=C:\\Users\\Administrator\\eclipse\\java-oxygen\\eclipse\\custom\\Ivy

path=C:\\Users\\Administrator\\eclipse\\java-oxygen\\eclipse\\custom\\Ivyde

4、将apache-ivy-2.5.0-rc1-bin-with-deps.zip解压出的ivy-2.5.0-rc1.jar文件放到C:\Users\Administrator\eclipse\java-oxygen\eclipse\custom\ivy\plugins文件夹里面。

5、将apache-ivyde-2.2.0.final-201311091524-RELEASE.zip解压出的plugins和features放到C:\Users\Administrator\eclipse\java-oxygen\eclipse\custom\Ivyde文件夹里面

6、重启eclipse。

1.6 Tomcat安装配置

下载"apache-tomcat-9.0.13.tar.gz",并解压到"NutchWorkPlat"目录下,并重新命名为"tomcat"。配置合适的端口号,要能够启动。

打开Windowàpreference对话框里看到tomcat一览,点击tomcat,把刚才解压的tomcat进行关联。

1.7 Cygwin安装配置

本次安装采用的是在线安装,一路next到底。

2、Eclipse开发

1  solr在tomcat上部署

      solr在5.x之后solr的目录结构已经发生了变化,不再提供war包,不能按照参考文档上面的方法进行部署.当然,solor有自部署的方法,但我们不用.

     第一步:把"solr-7.5.0.zip"解压到"E:\NutchWorkPlat"目录下,并命名为"solr"。

     第二步::将solor\server\solr-webapp\目录下的webapp文件夹复制到Tomcat\webapps\目录下,并改成solr (名字随意,通过浏览器进行访问solr管理界面时要用到)

     第三步:将 sol\server\lib\ext 中的 jar 文件全部复制到 Tomcat\ webapps\solr\WEB-INF\lib 目录中.(有重复文件,略过不覆盖)

     第四步:将 sol\server\lib\中以metrics为前缀的jar 文件(共5个)全部复制到 Tomcat\ webapps\solr\WEB-INF\lib 目录中.

     第五步:将 sol\dist\中以solr-dataimporthandler为前缀的jar 文件(共2个)全部复制到 Tomcat\ webapps\solr\WEB-INF\lib 目录中.

     第六步: 将 solor/ server/resources /log4j2.xml 复制到Tomcat\ webapps\solr\WEB-INF\classes 目录中(需创建classes文件夹)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值