关闭

linux下nutch2.3安装和编译

标签: nutch2.3安装和编译网络爬虫Apache
1443人阅读 评论(0) 收藏 举报
分类:
首先从官网上下载nutch2.3.
安装前要现在linux系统中配置环境:
<1>jdk1.7
<2>ant
<3>要保证linux系统能够联网。

jdk和ant的安装方法,都是使用tar -zxvf xxxx解压缩之后,配置一下环境变量JAVA_HOME,ANT_HOME。
然后java -version , ant -vesion 测试一下。

解压缩nutch2.3。
进入到nutch根目录


此时运行ant编译
#ant


在上面这一步可能会卡一会,表急,网络问题。等个几分钟就好了。如果长时间没反应,那么ctrl+c退出后重新输入
#ant编译,多试几次,多等等就ok了。
编译过程中如果有error那么就会中止。此时要对照报错信息区排错。
网上有些教程会在这里更改ivysetting.xml的配置文件。笨小葱一开始照着改了,发现有问题,有一些架包已经404了
。所以建议大家还是不要改动,直接编译,是可以顺利通过的,时间稍微久一点而已。(正常,笨小葱编译2次,都差不多半小时左右)

编译完成后会提示build successful  。在目录下会生成runtime文件,这里面就是编译好的nutch,nutch和crawl命令就在里面






1
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:42456次
    • 积分:790
    • 等级:
    • 排名:千里之外
    • 原创:35篇
    • 转载:15篇
    • 译文:0篇
    • 评论:21条