nutch系列2——nutch2.x的编译、安装和配置

这篇文章接上一节:nutch系列1——nutch简单介绍

准备工作:
1、JDK环境,参考:http://blog.csdn.net/enson16855/article/details/8708574
2、ant环境,参考:http://blog.csdn.net/enson16855/article/details/51375855

关于nutch的介绍,这个就不用多说啦,这边讲解的是nutch-2.3.1版本的编译安装
1、下载nutch-2.3.1:
地址:http://mirror.bit.edu.cn/apache/nutch/2.3.1/apache-nutch-2.3.1-src.tar.gz

也可以通过命令的形式直接下载:

wget http://mirror.bit.edu.cn/apache/nutch/2.3.1/apache-nutch-2.3.1-src.tar.gz 

2、解压nutch(目录:/opt/work/)

tar zxvf apache-nutch-2.3.1-src.tar.gz 

3、修改 $NUTCH_HOME/conf/nutch-site.xml 在 configuration节点中增加如下内容:

<property>
    <name>storage.data.store.class</name>
    <value>org.apache.gora.hbase.store.HBaseStore</value>
    <description>Default class for storing data</description>
</property>

4、修改 $NUTCH_HOME/ivy/ivy.xml 去掉如下注释,启用 gora-hbase:

<!-- Uncomment this to use HBase as Gora backend. -->

<dependency org="org.apache.gora" name="gora-hbase" rev="0.6.1" conf="*->default" />

这里写图片描述

5、修改$NUTCH_HOME/conf/gora.properties ,添加如下内容:

gora.datastore.default=org.apache.gora.hbase.store.HBaseStore

这里写图片描述

6、配置仓库地址
这边解释一下:如果不配置国内的镜像,使用官网的镜像,会出现不明的异常。保险起见

修改ivy中配置的maven仓库地址,具体方法:$NUTCH_HOME/ivy/ivysettings.xml 找到如下代码:

 <property name="repo.maven.org"
    value="http://maven.oschina.net/content/groups/public/"
    override="false"/>

这里写图片描述

7、接下来回到$NUTCH_HOME 目录
执行:

ant runtime

需要等待比较久的时间,因为要去远程下载依赖jar包

这里写图片描述

出现以上 SUCCESSFUL表示编译成功…

8、配置环境变量
编辑/etc/profile

vim /etc/profile

加入以下代码:

export NUTCH_HOME=/opt/work/apache-nutch-2.3.1/runtime/local
export PATH=$NUTCH_HOME/bin:$PATH

这里写图片描述

这里写图片描述

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mr-稻帅

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值