- 搭建好HA后,使用start-dfs.sh启动集群,发现namenode过一会(10s)就掉,
再通过hdfs --daemon start namenode 启动后,运行正常.
在core-site.xml中加入如下两个配置:
ipc.client.connect.max.retries
100
Indicates the number of retries a client will make to establish
a server connection.
-
把Active的NN kill掉, 另外两个StandBy的NN没有故障转移.
主要查看zkfc的日志.
可能的原因: java.lang.RuntimeExeption: Unable to fence Namenode at hostname / hostname:port
java.lang.RuntimeExeption: Unable to fence Namenode at hadoop102 / hadoop102:9000通过安装 yum install -y psmisc 组件解决问题。
-
在nn1上格式化NameNode以后, 在别的机器进行同步时报出如下异常
HA is not enabled for this namenode检查一下$HADOOP_HOME的环境变量是否指向新的ha集群。