在centos6.5上离线安装Cloudera Manager 以及CDH

注:

Cloudera的大数据集群安装个人感觉在centos上比较稳定,debian上安装出现问题没有解决成功

以下是离线安装的具体步骤:(安装CDH5.9.0版本)

1.准备资源

下载安装程序cloudera-manager-installer.bin
http://archive-primary.cloudera.com/cm5/installer/5.9.0//cloudera-manager-installer.bin

下载CM 5.9.0
http://archive-primary.cloudera.com/cm5/repo-as-tarball/5.9.0/cm5.9.0-centos6.tar.gz

下载CDH 5.9.0:
http://archive-primary.cloudera.com/cdh5/repo-as-tarball/5.9.0//cdh5.9.0-centos6.tar.gz

下载Navigator Keytrustee 5
http://archive-primary.cloudera.com/navigator-keytrustee5/redhat/6/x86_64/navigator-keytrustee/
以上地址是个目录,需要将其中的内容(包括所有子目录的内容)都下载下来,然后打成tgz包navigator-keytrustee5.tgz

2.操作系统安装

在每个物理节点上安装CentOS6.5 64位操作系统。

若节点比较多的话,可以使用VMware vSphere Client 导出ova,然后导入创建centos6.5

需要注意的是:
磁盘分配的时候,为了便于管理,除了交换分区,将整个磁盘分成一个区,挂载在跟路径(/)下。
在安装过程中,安装类型选择最小安装minimal,这样可以减少软件冲突,并且更节省资源。

为所有节点分配IP地址,本文档采用以下IP地址
    192.168.1.150        Hadoop.Master
    192.168.1.151        Hadoop.Slave1
    192.168.1.152        Hadoop.Slave2
    192.168.1.153        Hadoop.Slave3

操作系统配置
配置IP地址
打开网卡配置文件
vi /etc/sysconfig/network-scripts/ifcfg-eth0
在打开的文件中配置IP地址、子网掩码、默认网关等信息,需要把ONBOOT修改为yes
ONBOOT=yes
BOOTPROTO=static
IPADDR=192.168.1.150          #网卡IP地址
NETMASK=255.255.255.0        #网卡网络地址
GATEWAY=192.168.1.1          #网卡网关地址
DNS1=114.114.114.114           #网卡DNS地址
BROADCAST=192.168.1.255      #广播地址
NETWORKING_IPV6=no            #禁用IPv6
IPV6_AUTOCONF=no        #禁用IPv6
修改保存后,重启网络服务
service network restart

关闭SELinux
打开配置文件
        vi /etc/selinux/config
将SELINUX配置项修改为disabled
        SELINUX=disabled
保存退出

关闭iptables防火墙
关闭防火墙
        service iptables stop
        service ip6tables stop
将防火墙修改为开机不启动
        chkconfig iptables off
        chkconfig ip6tables off

配置主机解析
打开配置文件
        vi /etc/hosts
修改为以下内容
127.0.0.1                localhost
192.168.1.150       Master.Hadoop
192.168.1.151       Slave1.Hadoop

192.168.1.152      Slave2.Hadoop

192.168.1.153       Slave2.Hadoop

192.168.1.150       archive.cloudera.com

禁用IPv6
把IPV6内核模块设置为  开机不加载
vi /etc/modprobe.d/blacklist.conf
添加一行
blacklist ipv6
在系统控制配置文件中禁用IPv6
        vi /etc/sysctl.conf
新增行
        net.ipv6.conf.all.disable_ipv6=1

在/etc/sysctl.conf文件中新增一行
vm.swappiness=0

新建sqoop2组(这个组在最新的Cloudera安装过程中不会自动创建,需手动创建)
groupadd sqoop2

修改主机名,以NameNode为例,打开/etc/sysconfig/network,修改HOSTNAME
HOSTNAME=Master.Hadoop

配置完成后重启操作系统(这些配置步骤在NameNode和DataNode上均需要进行)。


安装CM 5.3.2
注:以下依赖的第三方包最好用yum通过公网自动安装,手动安装将需要处理非常麻烦的依赖关系
如果你安装CENTOS的时候不是选择的Minimal安装,1-4步骤可以跳过
安装Apache Httpd服务,安装完成后启动httpd服务
yum install httpd
service httpd start

安装Perl
yum install perl

安装openssh-clients
yum install openssh-clients

下载其他需要的包(在NameNode和DataNode上都需要安装)
yum install bind-utils
yum install libxslt
yum install cyrus-sasl-gssapi
yum install redhat-lsb
yum install cyrus-sasl-plain
yum install portmap
yum install fuse
yum install fuse-libs
yum install nc
yum install python-setuptools

移除除系统自带的repo源        
mkdir /etc/yum.repos.d.bak
        cd /etc/yum.repos.d
        mv * ../yum.repos.d.bak

新建私有源
在上一步的目录下,创建文件myrepo.repo,内容如下
[cm]
name=cm
baseurl=http://archive.cloudera.com/cm5/redhat/6/x86_64/cm/5/
enabled=1
gpgcheck=0

[cdh]
name=cdh
baseurl=http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/5/
enabled=1
gpgcheck=0

[navigator-keytrustee]
name=navigator-keytrustee
baseurl=http://archive.cloudera.com/navigator-keytrustee5/redhat/6/x86_64/navigator-keytrustee/5/
enabled=1
gpgcheck=0

将下载好的cm5.3.2-centos6.tar.gz发布在httpd服务中
cd /var/www/html/
mkdir -p cm5/redhat/6/x86_64
cd cm5/redhat/6/x86_64/
tar -xzvf /root/cm5.9.0-centos6.tar.gz -C ./
chmod -R ugo+rX cm

安装Cloudera Manager
./cloudera-manager-installer.bin








确认安装成功
安装完成后,执行命令确认服务是否启动
        service cloudera-scm-server status
在浏览器里面输入(用户名admin,密码admin)
http://192.168.1.150:7180/cmf/login
    登陆后选择免费使用



安装CDH 5.3.2
将下载好的cdh5.3.2-centos6.tar.gz发布到httpd服务中
cd /var/www/html
mkdir -p cdh5/redhat/6/x86_64
cd cdh5/redhat/6/x86_64
tar xzvf /root/cdh5.9.0-centos6.tar.gz -C ./
chmod -R ugo+rX cdh

执行命令
cd /var/www/html
mkdir -p navigator-keytrustee5/redhat/6/x86_64
cd navigator-keytrustee5/redhat/6/x86_64
tar xzvf /root/navigator-keytrustee5.tar.gz -C ./
chmod -R ugo+rX navigator-keytrustee


在浏览器打开http://192.168.0.150:7180用admin/admin登录,本文档的安装过程只将CDH装在NameNode(即NameNode和DataNode为一台物理机)上,在实际生产环境中需要将其安装在所有DataNode上。








至此,Cloudera大数据环境安装完毕

问题:
1、安装过程中安装包下载慢,尝试直接在命令行下执行yum命令,直接安装相应的rpm包
2.启动不成功,修改客户端 /etc/cloudera-scm-agent/config.ini配置文件中service_host 为cloudera_server地址或者主机名并开启server端口7182
如:server_host=10.12.116.102

3.想要删除管理主机,需要删除 psql或mysql中的注册的host对应的ip
使用psql工具连接数据库进行删除
4、正在检查 NameNode 的名称目录是否为空。仅在为空时格式化 HDFS。
删除rm –rf /dfs/*
•无法发出查询:Service Monitor 未运行
 增加角色用例---
5.卸载集群

//CDH5.X完全卸载步骤
# by coco
# 2015-01-14

1). 关闭集群中的所有服务。
 这个可以通过clouder manger 主页关闭集群。
2). 卸载
[root@master ~]# /usr/share/cmf/uninstall-cloudera-manager.sh

[root@slave1 ~]# service cloudera-scm-agent stop
[root@slave1 ~]# service cloudera-scm-agent stop

一下都是所有要卸载的集群均要执行清除工作:
[root@master ~]# umount /var/run/cloudera-scm-agent/process
[root@slave1 ~]# umount /var/run/cloudera-scm-agent/process
[root@slave2 ~]# umount /var/run/cloudera-scm-agent/process

[root@master ~]# rm -rf /usr/share/cmf /var/lib/cloudera* /var/cache/yum/x86_64/6/cloudera* /var/log/cloudera* /var/run/cloudera*  /etc/cloudera*

3). 卸载安装包:
[root@slave1 ~]# rpm -qa | grep cloudera
[root@slave2 ~]# for f in `rpm -qa | grep cloudera `  ; do rpm -e ${f} ; done     (如果有保存,在执行一遍)

4). 清除安装文件
 rm -rf /var/lib/hadoop-* /var/lib/impala /var/lib/solr /var/lib/zookeeper /var/lib/hue /var/lib/oozie  /var/lib/pgsql  /var/lib/sqoop2  /data/dfs/  /data/impala/ /data/yarn/  /dfs/ /impala/ /yarn/  /var/run/hadoop-*/ /var/run/hdfs-*/ /usr/bin/hadoop* /usr/bin/zookeeper* /usr/bin/hbase* /usr/bin/hive* /usr/bin/hdfs /usr/bin/mapred /usr/bin/yarn /usr/bin/sqoop* /usr/bin/oozie /etc/hadoop* /etc/zookeeper* /etc/hive* /etc/hue /etc/impala /etc/sqoop* /etc/oozie /etc/hbase* /etc/hcatalog

//只删除hadoop系列的,不要删除其他软件的,否则其他软件的版本控制会被破坏
[root@master alternatives]# rm -rf ` find /var/lib/alternatives/* ! -name "mta" ! -name "print" ! -name "zlibrary-ui"  -mtime -3`
[root@master alternatives]# rm -rf /etc/alternatives/*

5). 杀死相关进程:
for u in hdfs mapred cloudera-scm hbase hue zookeeper oozie hive impala flume; do sudo kill $(ps -u $u -o pid=); done

6). 删除parcel包分发文件和解压文件
  rm -rf /opt/cloudera/parcel-cache /opt/cloudera/parcels

到此卸载完毕。
5.org.apache.Hadoop.Hbase.TableExistsException: hbase:namespace这个错误只会出现在安装独立zookeeper的方案中,
当以前安装了一个版本,后来又换了一个新版本的时候会包这个错误,是因为上次安装的hbase信息在zookeeper目录下已经存在造成的,具体错误如下
解决方案:
登录到zookeeper节点的机器上
cd /ZOOKEEPER_HOME/bin下(/usr/lib/zookeeper/bin)
执行sh zkCli.sh
如上,执行ls /可以查看到zookeeper上已有hbase目录
执行rmr /hbase删除即可
重新启动hbase
6.ntp时间同步
yum install ntp
1). # rpm -ivh ntp-4.1.2-4.EL3.1.i386.rpm
2). # vi /etc/ntp.conf
注释一行
restrict default ignore
加入一行
restrict 192.168.10.0 mask 255.255.255.0 notrust nomodify notrap
3). # vi /etc/ntp/step-tickers
加入一行
pool.ntp.org
这样每次ntpd启动时,会自动连接该国际标准时间服务器;
4). # service ntpd start
5). # netstat -an |grep 123
确保该端口以udp方式开放
时间客户端配置(192.168.10.2)
1). # ntpdate 192.168.10.2
应该显示同步成功
2). # crond -e
加入
0-59/10 * * * * /usr/sbin/ntpdate 192.168.10.1
表示每隔10分钟同步一次时间

6 Unknow Health:
Unknow Health
重启后:Request to theHost Monitor failed.
service --status-all| grep clo
机器上查看scm-agent状态:cloudera-scm-agent dead but pid file exists
解决:重启服务
service cloudera-scm-agent restart
 service cloudera-scm-server restart
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

xianjie0318

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值