2021-03-10

最新推荐文章于 2021-11-21 12:10:25 发布

星尘之子

最新推荐文章于 2021-11-21 12:10:25 发布

阅读量98

点赞数

分类专栏：大数据 hdfs源码 Java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37613244/article/details/114645769

版权

hdfs源码同时被 3 个专栏收录

20 篇文章 2 订阅

订阅专栏

12 篇文章 0 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

1.8 删除/hadoop-ha/hdfsHACluser节点及其子节点

现象：两个Namenode都为Standby状态

解释：

两个Namenode被kill后，健康状态变为SERVICE_NOT_RESPONDING，运行quitElection方法，删除znode，销毁zookeeper客户端对象
两个Namenode重新上线后，HealthMonitor检测到健康状态为HEALTHY，会调用joinElection方法，尝试创建/hadoop-ha/hdfsHACluster/ActiveStandbyElectorLock节点，但hdfsHACluster节点被我们删除了，会报fatalError，ZKFC SHUTDOWN，两个Namenode维持standby状态
守护进程拉起ZKFC，ZKFC检测到父节点hdfsHACluster不存在，SHUTDOWN，之后进入不断重启的循环。
运行hdfs zkfc -formatZK后会创建/hadoop-ha/hdfsHACluster节点，之后流程和正常启动后类似，恢复正常。

1.9 Namenode磁盘空间不足

现象：SNN切换为ANN，ANN切换为SNN，可以继续读写文件

问题：此时，再kill ANN，SNN会不会变成ANN

解释：

HM检测到磁盘空间不足，健康状态变为SERVICE_UNHEALTHY，调用quitElection方法，断开连接，销毁zk客户端，锁节点自动删除
SNN watch到锁节点删除事件，joinElection，创建锁节点；fence原ANN节点，使其状态变为Standby；自己成为ANN
此时，再kill ANN，对SNN不会产生影响，因为SNN所在ZKFC已经没有zk客户端，HM一直处于“检测-UNHEALTHY”的循环。

1.10 znode数据异常（修改ActiveBreadCrumb节点内容）

现象：两个NN节点都为Standby状态

解释：

删除锁节点后，两个ZKFC都watch到这一事件，开始抢占创建锁节点
ZKFC1成功创建锁节点，开始fence另一个节点的NN
ZKFC1解析ActiveBreadCrumb中的信息失败，fence失败，rejoinElection（断开zk连接；joinElection）
ZKFC1断开zk连接后，锁节点删除，被ZKFC2观察到，创建锁节点，开始fence另一个节点的NN
ZKFC1和ZKFC2开始陷入3和4的死循环，两个NN一直处于Standby状态

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2021-03-10

1.8 删除/hadoop-ha/hdfsHACluser节点及其子节点现象：两个Namenode都为Standby状态解释：两个Namenode被kill后，健康状态变为SERVICE_NOT_RESPONDING，运行quitElection方法，删除znode，销毁zookeeper客户端对象两个Namenode重新上线后，HealthMonitor检测到健康状态为HEALTHY，会调用joinElection方法，尝试创建/hadoop-ha/hdfsHACluster/ActiveSta
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。