三台centos7机器构建hadoop集群,其中一台宕机后对其重启后再次加入集群
问题描述:准备关闭hdfs集群然后修改hdfs-site.xml文件后进行重启时偶然发现node03节点处于宕机状态(原因为无法连接网络,应该是网络问题导致机器无法上网),如下信息所示:
后对node03机器重启后网络功能恢复
然而重启之后,node03机器的zookeeper,hdfs等功能均为关闭状态,需要重启并加入机器,操作方式如下:
-
启动noed03机器的zookeeper
[root@node03 zookeeper-3.4.9]# cd bin/ [root@node03 bin]# ls README.txt zkCli.cmd zkEnv.cmd zkServer.cmd zookeeper.out zkCleanup.sh zkCli.sh zkEnv.sh zkServer.sh [root@node03 bin]# zkServer.sh start
-
node01主机启动再次启动hdfs
[root@node01 sbin]# start-dfs.sh
-
node01主机再次启动yarn
[root@node01 sbin]# start-yarn.sh starting yarn daemons resourcemanager running as process 1742. Stop it first. node01: nodemanager running as process 1847. Stop it first. node02: nodemanager running as process 1407. Stop it first. node03: starting nodemanager, logging to /export/servers/hadoop-2.7.5/logs/yarn-root-nodemanager-node03.out
node1和node2已经正常运行且在集群中,node01主机再次运行启动命令,则已经启动的机器将无影响,未启动的机器则被开启
(PS:hadoop集群的启动,首先要建立在zookeeper是启动的状态下)