Hadoop-2.4.1学习之使用Quorum Journal Manager的HDFS的高可用性(一)

49 篇文章 22 订阅 ¥9.90 ¥99.00
29 篇文章 18 订阅 ¥9.90 ¥99.00
本文介绍了Hadoop-2.4.1版本中为解决NameNode单点故障问题引入的高可用性(HA)特性。通过运行两个NameNode,一个active,一个standby,配合JournalNodes(JNs)实现状态同步,确保在NameNode故障时能快速恢复。JNs记录namespace更改,standby NameNode从JNs获取记录并保持同步。在故障切换中,standby NameNode需确保读取所有记录,保证命名空间状态一致。HA集群的关键在于任何时候只有一个NameNode是active,避免数据不一致的“分裂大脑”场景。
摘要由CSDN通过智能技术生成

       在Hadoop-2.x版本之前,HDFS集群中的NameNode是单点故障的,即整个集群中只存在一个NameNode,虽然存在SecondaryNameNode,但由于二者关于命名空间的数据有可能不一致,比如NameNode在两次检查点间隔之间出现问题,这势必会导致部分数据的丢失。如果NameNode所在的主机或者namenode进程不可用,整个集群直到NameNode重启或者转移到SecondaryNameNode所在主机为止将使不可用的。上述情况主要以下面两种方式影响HDFS集群的整体可用性:

  • 当出现非计划中的事件时如主机宕机,直到管理员重启NameNode为止,集群将不可用。
  • 当进行计划中的维护事件时,如在NameNode主机上执行软硬件升级,将导致集群停机。

       HDFS的高可用性(High Availability  HA)特性解决了上述问题。通过在同一个集群中运行两个冗余的NameNode,其中一个处于active状态,另一个处于standby状态实现了热备份。这允许当其中一台主机宕机时能够进行快速故障恢复到另一个NameNode,或者在按计划维护时能够平滑地切换。

       在简单了解了HDFS的高可用性及其优点后,现在学习一下HA的架构。在典型的HA集群中,两台单独的主机被配置为NameNode,任何时候只有一个NameNode处

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

skyWalker_ONLY

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值