问题描述
原有Cloudera Manager的cm库被删,导致Cloudera Manager不可用。
后由于其他原因,导致集群服务不可用,且手动重启失败。
解决方案
重新安装Cloudera Manager及CDH集群,接管原集群数据。
问题复现
1.搭建CDH集群,在hive中插入测试数据
2.删除Cloudera Manager的cm库,导致Cloudera Manager不可用
解决步骤
1.停止集群上的所有服务,我这里选择的直接reboot
2.重新创建cm库()
3.执行 find / -name cm_guid
然后删除三台节点上的cm_guid(如果不删除的话,重装cm无法加载检查主机,会提示主机状态异常)
4.重启cloudera-scm-server 及所有的cloudera-scm-agent
5.重新登录Cloudera Manager,发现让重新安装集群,按照步骤正常操作即可
6.尽量与之前选装组件一致(亲测不一致也没啥问题)
7.与之前角色分配一致(笔者未测试不一致的情况)
8.选择之前的数据库
9.集群设置与之前保持一致(建议提前备各组件配置文件)
10.安装至此会报错,此时我们点击左上角图标直接返回主页
11.直接启动集群即可
12.启动成功
13.打开hue,数据访问正常(注意,第二次我没装Impala)