cloudera manager的重建

最新推荐文章于 2024-03-28 09:58:54 发布

y小鱼

最新推荐文章于 2024-03-28 09:58:54 发布

阅读量405

点赞数

分类专栏： hadoop 集群

本文链接：https://blog.csdn.net/weixin_44439549/article/details/109023254

版权

hadoop 集群专栏收录该内容

8 篇文章 0 订阅

订阅专栏

cm的重建

难题
cdh的cm节点完全挂掉之后，根据：

https://www.bbsmax.com/A/nAJv0kGdrk/

https://community.cloudera.com/t5/Cloudera-Manager-Installation/cloudera-manager-database-lost/td-p/31989

的说明，本来打算进行重建式的恢复。

但此方法隐藏的风险巨大，包括已经运行了很久的集群配置，有不少的变化，很难保证完全还原。

另外，我们的cdh这次要修复的情况，和网上的情况有不同：

网上是cm加scm数据库都挂了，可能还涉及hdfs主节点的修复；

我们是cm挂了，moniter服务挂了，数据库完好，hdfs等服务还在正常运行。

根据官方文档：https://www.cloudera.com/documentation/enterprise/5-6-x/topics/cm_ag_restore_server.html

原本以为必须要原样的/var/lib/cloudera-scm-server目录下的内容，才能恢复。

在hd-cm启动时，我们拿到了此内容，并在其它机器上试过，启动不了。加深了对“不可恢复”的理解。

但其实，问题并非如此复杂。

观察
利用test[1-5]的机器，搭建了测试用小集群。在反复实验的过程中，发现了如下情况：

1 /var/lib/cloudera-scm-server 目录下的内容，主要是temp search commands，这些内容，即使清空，也能由scm数据库恢复。

2 monitor服务本身，是一种agent进程，和/var/lib/cloudera-scm-server 目录内容无关。

3 monitor服务，可以经由cm管理界面，重建。

4 原集群scm表前后，并没有本质的变化（原以为是大变，导致集群暂停）

对cdh的搭建方法，也进行了一些调查。在之前试的过程中，安装的方式有一些缺点。

cdh的安装
http://www.jianshu.com/p/331d36558ee2

http://blog.csdn.net/jjfnjit/article/details/49099015

cdh整体的示意图如下，服务和数据是分离的，这也是能够重建cm的本质原因。

过程如下：

cm机器在10.96.30.173

关闭iptables
$ service iptables stop
$ chkconfig iptables off

关闭SELINUX
$ vim /etc/selinux/config
$ SELINUX=disabled

依赖的软件服务（在要安装CM的机器上进行，需要上网）
#yum -y install postgresql-server
yum -y install httpd
yum -y install perl
yum -y install bind-utils
yum -y install cyrus-sasl-gssapi
yum -y install nc
yum -y install openssh-clients

主要是为了装httpd服务

准备cm和cdh的包
http://archive.cloudera.com/cm5/redhat/6/x86_64/cm/5.3.2/
=> /var/www/html/cloudera-manager/5.3.2

http://archive-primary.cloudera.com/cdh5/parcels/5.3.2/

=> /var/www/html/parcels/5.3.2

（parcels的sha1文件改为sha文件）

所有文件在：/var/data/dmp2/cdh5.3.2_install

事实证明只要这两种文件集，就足够了

（可选：把本机作为archive.cloudera.com）

$ service httpd start
$ chkconfig httpd on

创建yum源
$ vim /etc/yum.repos.d/cloudera-manager.repo
[cloudera-manager]
name=cloudera manager
baseurl=http://10.96.30.173/cloudera-manager/5.3.2
enabled=1
gpgcheck = 0

将文件scp到要安装的其它机器上

所有机器，yum clean all

其中是包括java的安装包的

安装jdk
所有节点：

$ yum install oracle-j2sdk1.7
配置Java环境变量，执行：

$ ln -s /usr/java/jdk1.7.0_67-cloudera /usr/java/default
$ echo -e ‘export JAVA_HOME=/usr/java/default’ >> /etc/profile
$ echo -e ‘export PATH= $JAVA_HOME/bin:$ PATH’>> /etc/profile
$ echo -e ‘export CLASSPATH=.:$JAVA_HOME/lib’>> /etc/profile
$ source /etc/profile