状况1:
此时很可能是集群该台host机器的cloudera-scm-agent进程挂掉了,改进程用于与Cloudera Manager进行通信
解决方案:在该台机器上,输入命令/etc/init.d/cloudera-scm-agent status查看该进程的状态
如果提示“Checking for service cloudera-scm-agent * cloudera-scm-agent is dead and pid file exists” 表明该进程已近挂掉,
于是需要启动一下,输入命令:“/etc/init.d/cloudera-scm-agent start ” ,重启服务,可以解决
状况2:
如果集群主机的状态都是“unkown health”,那么有极大的可能是udms-113(运行有service monitor的服务,个人感觉。。。)这台机器的cloudera-scm-agent 服务挂掉,用上面的方法重启该台机器上面的cloudera-scm-agent服务即可。
如果提示连接超过阈值,可能是与101的机器时差过大,可通过以下命令与101时钟同步
sudo ntpdate 172.21.1.101
修改IP地址和网关
sudo /etc/init.d/networking restart
ifconfig
sudo vim /etc/network/interfaces
address 192.168.2.1
gateway 192.168.2.254
netmask 255.255.255.0
sudo /etc/init.d/networking restart