最近部署了一个CDH环境,突然发生了添加主机之后,提示主机状态异常,然后就无法分发CDH parcel。
这个问题困扰了将近半天的时间,一直翻查各种日志,最后在agent的日志中发现了问题。
主要原因是
第一遍部署CDH环境成功以后,由于mysql重启异常,强制杀死后,导致了CM无法正常连接mysql。然后进行第二遍部署。
在第二遍部署的时候,由于第一遍部署完成以后各个主机上的agent仍然在运行,新部署的CM 无法识别到 第一遍部署的agent传来的uuid,导致agent开启,也无法到CM上正常注册。
解决方法:
1、卸载各个节点上的agent (rpm -e)
2、删除各个主机上旧的agent目录 /etc/cloudera-scm-agent /var/lib/cloudera-scm-agent /var/log/cloudera-scm-agent
3、重新在CM中添加新的主机
4、添加成功。