HDFS 高可用性 + 容错机制

最新推荐文章于 2025-04-17 22:17:13 发布

蕾欧娜等等

最新推荐文章于 2025-04-17 22:17:13 发布

阅读量1.7k

点赞数

分类专栏：大数据技术文章标签： hadoop 分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38746310/article/details/108087530

版权

本文深入探讨了HDFS的高可用性，包括Active和Standby NameNode的角色，以及ZKFailoverController如何确保主备切换。重点介绍了基于QJM的共享存储系统，其利用Paxos算法确保EditLog的可靠性。此外，还详细阐述了数据同步和容错机制，如节点失败、网络故障和数据损坏的检测与处理策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

上一篇博客介绍了 HDFS 的基本概念，读写流程以及NameNode，SecondaryNameNode 以及 DataNode 的工作机制。这篇博客介绍 HDFS 的高可用性和容错机制。

HDFS 的高可用性

HDFS的高可用指的是HDFS持续对各类客户端提供读、写服务的能力，因为客户端对HDFS的读、写操作之前都要访问name node服务器，只有从name node获取元数据之后才能继续进行读、写。所以HDFS的高可用的关键在于name node上的元数据持续可用。

在 hadoop 1.x 的 HDFS 框架中只存在一个 namenode 节点，当这个 namenode 节点出现内存溢出、宕机等意外情况之后，整个系统就会停止服务，直到我们重启这个 namenode 节点。为了解决这个问题，在 hadoop2.x 的 HDFS 框架中，实现了 HA 的机制。

在高可用配置下，edit log不再存放在名称节点，而是存放在一个共享存储的地方，这个共享存储由奇数个Journal Node组成，一般是3个节点(JN小集群)，每个JN专门用于存放来自NN的编辑日志，编辑日志由活跃状态的名称节点写入JN小集群。

在这里插入图片描述
解释：

Active NameNode 和 Standby NameNode：两台 NameNode 形成互备，一台处于 Active 状态，

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。