安装CDH时候出现主机运行状态不良情况的解决(Agent的集群id与当前Server集群id不匹配造成的)

现象

通过Cloudera WEB界面安装Hadoop过程中,在安装Parcel步骤时,一个节点分配激活失败,报错信息显示”主机运行状况不良”,如下图所示。

这里写图片描述

分析

CM的集群是Server-Agent模式的,那么必须有一个唯一的id来标识Server和Agent属于同一个集群,在Agent端就是使用cm_guid文件来记录id的。

假设server端重新安装了一遍,重新构建集群,而agent没有重新安装,那么他们的id是一定不同的,就会造成上面的异常。

解决

删除agent目录下面的cm_guid文件,并重启失败节点的agent服务恢复。

寻找cm_guid文件的位置

1) 如果cloudera-manager-agent是离线安装的,那么cm_guid文件的位置是,当初安装cloudera-manager的位置,删除之,然后重启。

rm -f /opt/cloudera-manager/cm-5.11.1/lib/cloudera-scm-agent/cm_guid
./cloudera-scm-agent  restart 
2) 如果cloudera-manager-agent是在线安装的,那么cm-guid文件的位置是/var/lib/cloudera-scm-agent/cm_guid

[root@esgyn001 ~]# cd /var/lib/cloudera-scm-agent/
cm_guid        response.avro  uuid           
[root@esgyn001 cloudera-scm-agent]# rm -rf cm_guid 
[root@esgyn001 cloudera-scm-agent]# service cloudera-scm-agent restart
Stopping cloudera-scm-agent:                               [  OK  ]
Starting cloudera-scm-agent:                               [  OK  ]

也可以用find命令查找文件:

[root@cdh-70 ~]# find / -name cm_guid
/var/lib/cloudera-scm-agent/cm_guid
[root@cdh-70 ~]# rm -rf /var/lib/cloudera-scm-agent/cm_guid      --删除文件
[root@cdh-70 ~]# /etc/init.d/cloudera-scm-agent restart       --重启服务

cm_guid文件的内容

cm_guid文件的内容大概是uuid,用于唯一标示agent隶属于哪一个server。

官方参考文档

参考官网说明:Block agents from heartbeating to a Cloudera Manager with different UUID until agent restart








  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值