今天公司的测试hadoop集群,ambari 出现问题。特此总结。
公司的集群用的是hortonworks的hdp2.4,ambari2.2 版本的。 服务器版本是Redhat6.4。
1. 问题描述:
今天发现集群中的一台节点上的ambari-agent连接失败,进而导致该节点上的其他服务都管理不到。该节点还是主要的节点。
查看日志发现可能是该节点上安装的python版本冲突的问题。
这个是启动的时候报的错误。 因为ambari-agent我最后重装了,日志文件已经丢失没办法贴出来,只贴出来了这个之前记下的启动问题。
[root@Master ~]# ambari-agent start
Verifying Python version compatibility...
Using python /usr/bin/python2
Checking for previously running Ambari Agent...
/usr/sbin/ambari-agent: line 74: ambari-sudo.sh: command not found
/usr/sbin/ambari-agent: line 76: ambari-sudo.sh: command not found
/usr/sbin/ambari-a