Hadoop HDFS高可用（HA）

最新推荐文章于 2024-04-22 00:15:00 发布

「已注销」

最新推荐文章于 2024-04-22 00:15:00 发布

阅读量6k

点赞数 8

分类专栏： Hadoop 架构与设计文章标签： hadoop hdfs

本文链接：https://blog.csdn.net/bingduanlbd/article/details/51946540

版权

本文详细介绍了Hadoop HDFS的高可用（HA）架构，包括使用NFS共享存储和Quorum-based存储（QJM）+ ZooKeeper实现自动故障转移。通过配置Active/Passive模式的Namenode，借助Journal Node和Zookeeper实现故障检测和自动切换，以提高集群的可用性和数据安全性。同时，文章讨论了Zookeeper在故障转移中的作用以及部署和配置HA集群的关键步骤。

摘要由CSDN通过智能技术生成

版本记录：

2016-07-19 凌晨初稿

在Hadoop 1.x 中，Namenode是集群的单点故障，一旦Namenode出现故障，整个集群将不可用，重启或者开启一个新的Namenode才能够从中恢复。值得一提的是，Secondary Namenode并没有提供故障转移的能力。集群的可用性受到影响表现在：

当机器发生故障，如断电时，管理员必须重启Namenode才能恢复可用。
在日常的维护升级中，需要停止Namenode，也会导致集群一段时间不可用。

架构

Hadoop HA（High Available）通过同时配置两个处于Active/Passive模式的Namenode来解决上述问题，分别叫Active Namenode和Standby Namenode. Standby Namenode作为热备份，从而允许在机器发生故障时能够快速进行故障转移，同时在日常维护的时候使用优雅的方式进行Namenode切换。Namenode只能配置一主一备，不能多于两个Namenode。

主Namenode处理所有的操作请求（读写），而Standby只是作为slave，维护尽可能同步的状态，使得故障时能够快速切换到Standby。为了使Standby Namenode与Active Namenode数据保持同步，两个Namenode都与一组Journal Node进行通信。当主Namenode进行任务的namespace操作时，都会确保持久会修改日志到Journal Node节点中的大部分。Standby Namenode持续监控这些edit，当监测到变化时，将这些修改应用到自己的namespace。

当进行故障转移时，Standby在成为Active Namenode之前，会确保自己已经读取了Journal Node中的所有edit日志，从而保持数据状态与故障发生前一致。

为了确保故障转移能够快速完成，Standby Namenode需要维护最新的Block位置信息，即每个Block副本存放在集群中的哪些节点上。为了达到这一点，Datanode同时配置主备两个Namenode，并同时发送Block报告和心跳到两台Namenode。

确保任何时刻只有一个Namenode处于Active状态非常重要，否则可能出现数据丢失或者数据损坏。当两台Namenode都认为自己的Active Namenode时，会同时尝试写入数据（不会再去检测和同步数据）。为了防止这种脑裂现象，Journal Nodes只允许一个Namenode写入数据，内部通过维护epoch数来控制，从而安全地进行故障转移。

有两种方式可以进行edit log共享：