原因:因原先使用的路由器信号不好,更换了路由器后机器的IP更换了,导致机器无法正常启动服务。
注:该文档适用于CDH集群中,节点IP地址发生变化,集群无法正常启动的场景
解决方法
首先停止CDH集群
在各个节点上,停止尚在运行的CDH服务
1、master节点上停止以下服务
systemctl stop cloudera-scm-server
systemctl stop cloudera-scm-agent
2、slaves节点上停止的服务:systemctl stop cloudera-scm-agent
3、修改CDH集群中IP为新的IP,cm库hosts表中
4、配置各节点物理IP地址
vim /etc/sysconfig/network-scripts/ifcfg-ensxxx(xxx需要根据自己的机器修改)
5、修改各节点Hosts映射
vim /etc/hosts
6、修改NTP服务
这一步主要是让各节点的时间同步,简单使用ntp命令就可以。
7、配置各节点agent中对应的ip(最重要一点,否则各个slave节点无法与master节点通信)
修改每个节点上:vi /etc/cloudera-scm-agent/config.ini
修改server_host的值(这个是指定cloudera-scm-server的ip)
8、启动CDH集群
Scm-server节点
service mysqld start(如果无法启动进行操作:vim /etc/my.cof mkdir /var/run/mysqld/ chown mysql.mysql /var/run/mysqld/)
systemctl restart cloudera-scm-server
systemctl restart cloudera-scm-agent
Scm-agent节点
systemctl restart cloudera-scm-agent
如果尚未正常启动,需要重新分配并激活Parcel中的 CDH。、
下面是修正成功后主机管理界面:
ps: 如果启动了HDFS HA机制,此时有可能HDFSD Client会链接到了Standy节点 而非Active; 最简单的办法就是直接关闭HDFS HA;即可恢复。 如果还想恢复HA,直接在重新开启(重新开启为推断,尚未具体验证)