HDFS 高可用（HA）

最新推荐文章于 2024-07-22 13:23:20 发布

萌萌哒的理工男

最新推荐文章于 2024-07-22 13:23:20 发布

阅读量363

点赞数

分类专栏： Hadoop # HDFS 文章标签： HA 高可用 HDFS

本文链接：https://blog.csdn.net/qq_38924171/article/details/100694524

版权

22 篇文章 1 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

HDFS 集群高可用（HA）

所谓的HA(High available),简称高可用(7*24不间断服务)

准备两个相同的应用程序,一个对外提供服务,成为主程序,另外一个平时不运行(主要负责根对外提供服务的机器进行数据同步等操作),称之为从程序或备份程序,即从程序是主程序的一个备份,等主程序出现问题的时候,再顶上去。

准备两个相同的应用程序,同时对外提供服务(这时两个主程序相互做对方的备份)当其中一个程序出现问题的时候,另外一个程序可以同样对外提供访问。

跟双主互备一样,只不过备份的数量多一些而已。

NameNode在Hadoop2.x之前HDFS中只有一个NameNode会对外提供访问,此时会出现一个致命问题, 就是单点故障和性能瓶颈(联邦)

NameNode在主要有以下两个方面影响

HDFS HA就是配置一个NameNode Active(活)和另外一个NameNode Standby(备份),如果Active节点出现问题,standby的节点会继续提供服务,就可以防止单点故障.。

hadoop2.x之后，Clouera提出了QJM/QuromJournal Manager，这是一个基于Paxos算法实现的HDFS HA方案，它给出了一种较好的解决思路和方案

基本原理就是用2N+1台 JN 存储EditLog，每次写数据操作有大多数（>=N+1）返回成功时即认为该次写成功，数据不会丢失了。当然这个算法所能容忍的是多有N台机器挂掉，如果多于N台挂掉，这个算法就失效了。这个原理是基于Paxos算法
在HA架构里面SecondaryNameNode这个冷备角色已经不存在了，为了保持standby NN时时的与主Active NN的元数据保持一致，他们之间交互通过一系列守护的轻量级进程JournalNode。
任何修改操作在 Active NN上执行时，JN进程同时也会记录修改log到至少半数以上的JN中，这时Standby NN 监测到JN 里面的同步log发生变化了会读取 JN 里面的修改log，然后同步到自己的的目录镜像树里面
当发生故障时，Active的 NN 挂掉后，Standby NN 会在它成为Active NN 前，读取所有的JN里面的修改日志，这样就能高可靠的保证与挂掉的NN的目录镜像树一致，然后无缝的接替它的职责，维护来自客户端请求，从而达到一个高可用的目的。
QJM方式来实现HA的主要优势：