首先从官网上下载nutch2.3.
安装前要现在linux系统中配置环境:
<1>jdk1.7
<2>ant
<3>要保证linux系统能够联网。
jdk和ant的安装方法,都是使用tar -zxvf xxxx解压缩之后,配置一下环境变量JAVA_HOME,ANT_HOME。
然后java -version , ant -vesion 测试一下。
解压缩nutch2.3。
进入到nutch根目录
此时运行ant编译
#ant
在上面这一步可能会卡一会,表急,网络问题。等个几分钟就好了。如果长时间没反应,那么ctrl+c退出后重新输入
#ant编译,多试几次,多等等就ok了。
编译过程中如果有error那么就会中止。此时要对照报错信息区排错。
(
网上有些教程会在这里更改ivysetting.xml的配置文件。笨小葱一开始照着改了,发现有问题,有一些架包已经404了
。所以建议大家还是不要改动,直接编译,是可以顺利通过的,时间稍微久一点而已。(正常,笨小葱编译2次,都差不多半小时左右))
编译完成后会提示build successful 。在目录下会生成runtime文件,这里面就是编译好的nutch,nutch和crawl命令就在里面