【运维】Hadoop集群异常:两个NameNode全部为StandBy状态

1. 查看zkfc进程是否挂掉

查看之前的文章:记一次flink on hadoop with per-job 报错排查 ,重新回顾一下HDFS的高可用:

主备切换的逻辑:
active节点通过zkfc将状态写到zk中,standBy对此状态感兴趣添加监听,当active宕机,zkfc立即通知standy转换为active。

当zkfc挂掉之后,这些namenode节点状态则不能维护和相互同步,就有可能都为standy。

重启zkfc之后namenode正常

 
 

2. 初始化zookeeper来重新竞选

namenode的高可用是zk维护实现的,可以尝试初始化namenode在zookeeper的元数据。

//任选一台StandBy状态的节点做zk的初始化。
hdfs zkfc -formatZK

//sbin目录下重启集群
start-dfs.sh
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

roman_日积跬步-终至千里

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值