Hadoop HA (一) --------- HA 概述与 HDFS-HA 集群搭建

最新推荐文章于 2024-04-29 21:44:11 发布

在森林中麋了鹿

最新推荐文章于 2024-04-29 21:44:11 发布

阅读量900

点赞数

分类专栏： Hadoop HA 文章标签： hadoop hdfs 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_51111980/article/details/126060208

版权

Hadoop HA 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

目录

一、HA 概述
二、HDFS-HA 集群搭建

一、HA 概述

所谓 HA (High Availablity)，即高可用 (7*24 小时不中断服务) 。实现高可用最关键的策略是消除单点故障。HA 严格来说应该分成各个组件的 HA。

机制：HDFS 的 HA 和 YARN 的 HA。

NameNode 主要在以下两个方面影响 HDFS 集群

NameNode 机器发生意外，如宕机，集群将无法使用，直到管理员重启
NameNode 机器需要升级，包括软件、硬件升级，此时集群也将无法使用

HDFS HA 功能通过配置多个 NameNodes (Active/Standby) 实现在集群中对 NameNode 的热备来解决上述问题。如果出现故障，如机器崩溃或机器需要升级维护，这时可通过此种方式将 NameNode 很快的切换到另外一台机器。

二、HDFS-HA 集群搭建

当前 HDFS 集群的规划

在这里插入图片描述

HA 的主要目的是消除 NameNode 的单点故障,需要将 HDFS 集群规划成以下模样

在这里插入图片描述
HDFS-HA 核心问题

1）怎么保证三台 NameNode 的数据一致

A、Fsimage : 让一台 nn 生成数据，让其他机器 nn 同步

B、Edits : 需要引进新的模块 JournalNode 来保证 edtis 的文件的数据一致性

2）怎么让同时只有一台 nn 是 active，其他所有是 standby 的

A、手动分配

B、自动分配

3）2nn 在 HA 架构中并不存在，定期合并 fsimage 和 edtis 的活谁来干

由 standby 的 nn 来干

4）如果 nn 真的发生了问题，怎么让其他的 nn 上位干活

A、手动故障转移

B、自动故障转移

在森林中麋了鹿

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
Hadoop HA (一) --------- HA 概述与 HDFS-HA 集群搭建

HDFS 集群搭建
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

在森林中麋了鹿 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。