集群的高可用性----自动故障转移

最新推荐文章于 2024-07-24 08:38:35 发布

小口天,

最新推荐文章于 2024-07-24 08:38:35 发布

阅读量1.7k

点赞数

分类专栏： Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/WQY992/article/details/92241531

版权

本文详细介绍了HDFS实现自动故障转移的机制，包括利用Apache ZooKeeper进行故障检测和选举，ZKFailoverController组件的运行原理，以及集群模式下Zookeeper的安装和配置。在故障发生时，如NameNode主机故障，ZooKeeper会触发Active NameNode的选举，确保服务的连续性。

摘要由CSDN通过智能技术生成

自动容灾

当状态为Active的Namenode主机发生故障时，HDFS进行自动故障转移，让状态为Standby的Namenode主机转成状态为Active的Namenode进行工作。

组件

自动故障转移为HDFS部署添加了两个新组件：

Apache ZooKeeper：
是一种高可用性服务，用于维护少量协调数据，通知客户端该数据的更改以及监视客户端是否存在故障。自动HDFS故障转移的实现依赖于ZooKeeper来实现以下功能：

故障检测
集群中的每个NameNode计算机都在ZooKeeper中维护一个持久会话。如果计算机崩溃，ZooKeeper会话将过期，通知另一个NameNode应该触发故障转移。
Active NameNode选举
ZooKeeper提供了一种简单的机制，可以将节点专门选为活动节点。如果当前活动的NameNode崩溃，则另一个节点可能在ZooKeeper中采用特殊的独占锁，指示它应该成为下一个活动的节点。

ZKFailoverController（ZKFC）：
是一个新组件，它是一个ZooKeeper客户端，它还监视和管理NameNode的状态。运行NameNode的每台机器也运行ZKFC，ZKFC负责：

运行状况监视
ZKFC定期使用运行状况检查命令对其本地NameNode进行ping操作。只要NameNode及时响应健康状态，ZKFC就认为该节点是健康的。如果节点已崩溃，冻结或以其他方式进入了不健康状态，则运行状况监视器会将其标记为运行状况不佳。
ZooKeeper会话管理
当本地NameNode运行正常时，ZKFC在ZooKeeper中保持会话打开。如果本地NameNode处于活动状态，它还拥有一个特殊的“锁定”znode。此锁使用ZooKeeper对“短暂”节点的支持; 如果会话过期，将自动删除锁定节点。
基于ZooKeeper的选举
如果本地NameNode是健康的，并且ZKFC发现没有其他节点当前持有锁znode，它将自己尝试获取锁。如果成功，那么它“赢得了选举”，

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。