Hadoop集群的快速部署

我的集群部署在局域网内部,与外网隔离开来。这个主要处于安全性考虑,在公网使用一段时间linux,你用 sudo cat /var/log/secure 查看安全日志会发现,每天都有一大堆居心不良的人在试探你的sshd服务。当然这个可以通过配置 sshd 来避免,不过还是谨慎为妙。

闲话少说,步入正题。我的网络结构是这样的:我的机器通过多IP配置与集群在一个网段,也可以在另一个网段通过拨号上网。我机器的操作系统是Fedora 13,集群上的机器是CentOS。
我快速部署的思路是这样的:在我的机器上下载cloudera.com上的hadoop安装包,然后在自己的机器上配置一个 yum 源,集群通过yum来批量升级和安装hadoop。

第一步,下载安装包和相关文件。
其实 cloudera 就有一个 yum源,查看一下http://archive.cloudera.com/redhat/cdh/3/ ,yum源的结构就很清晰了。

wget -mc http://archive.cloudera.com/redhat/cdh/3/

在当前文件夹下就有一个archive.cloudera.com的文件夹。

第二步,配置本地源。
mkdir /var/www/html/cloudera-hadoop
cp -r archive.cloudera.com/redhat/cdh/3 /var/www/html/cloudera-hadoop
这里是将对应的安装包和文件考到 web 目录下。
注意这里需要使用的 httpd 服务,没开启服务的话,使用service httpd start开启,没有apache软件的话,使用 sudo yum install apache安装。

然后自己做一个repo文件:
vi cloudera-hadoop.repo

内容:
[cloudera-cdh3]
name=Cloudera's Distribution for Hadoop, Version 3
baseurl=http://192.168.0.240/cloudera-hadoop/3/
gpgcheck = 0

192.168.0.240是我机器在集群网段的IP。

第三步,集群yum配置。
将cloudera-hadoop.repo拷到集群机器的 /etc/yum.repos.d/目录下。
然后在集群机器上更新yum: sudo yum update yum
在列表中看到 hadoop 的rpm包就差不多了。

接着,yum install hadoop-0.20 //安装hadoop主文件
yum install hadoop-0.20-<daemon type> //安装hadoop相关配置
sudo yum install <CDH3-component-name> //安装hadoop相关组件
这里可以参考cloudera官网的有关说明:
https://docs.cloudera.com/display/DOC/CDH3+Installation

除了主节点外,其他节点配置相同可以用集群管理命令 psh 批量安装。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值