[hadoop]什么是HA｜普通HDFS和HA的不同｜HA自动故障转移机制

胖胖学编程

已于 2022-03-14 11:00:02 修改

阅读量1k

点赞数

分类专栏： hadoop 文章标签： hadoop

于 2022-03-10 11:27:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35896718/article/details/123397300

版权

hadoop 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

1.什么是HDFS HA

1)HA=high available(高可用),即7*24小时不中断服务

2)实现高可用最关键的策略是消除单点故障,HA分为HDFS HA和yarn HA.

3)HDFS NameNode单点故障的原因

[1]NameNode宕机

[2]NameNode需要升级,包括软件或硬件的升级

4)HDFS HA功能通过配置active/standby两个NameNode实现在集群对NameNode的热备份来解决NameNode单点故障的问题.

注:热备份是在系统处于正常运转状态下的备份.

2.HDFS HA与普通HDFS的不同

1)多了两个组件

ZooKeeper,ZKFC

2)元数据的管理方式需要改变

两个NameNode各有一份内存元数据和磁盘元数据镜像文件.

注:stand by状态的NameNode会不断拉取active状态的NameNode的写对的edits,在内存中同步到最新的状态(内存元数据),这个进行同步的操作由JournalNode做,edits操作日志只有active状态的NameNode节点可以做写操作,两个NameNode都可以读取edits.共享的edits放在一个共享存储中管理(qjournal).

3)如何切换NameNode

[1]ZKFC

在每个NameNode所在节点添加了一个zkfailoverController(ZKFC),ZKFC是一个zookeeper客户端.每个ZKFC负责监控自己所在的NameNode,他负责NameNode状态的监控.切换时需要防止brain split(脑裂)的发生.

[2]隔离(fence)

即同一时刻仅仅有一个NameNode对外提供服务.

3.HDFS HA自动故障转移工作机制

1active状态的NameNode假死了

2.它内存的ZKFC进程检测到了它的假死

3.该ZKFC通知另一台处于standby状态的NameNode的ZKFC

4.处于standby状态的NameNode的ZKFC强行杀死active状态的NameNode，防止脑裂.

执行 ssh kill -9 namenode

如果执行失败则调用用户自定义脚本程序 /shells/poweroff.sh

5.ZKFC获取命令运行结果

6.ZKFC切换该NameNode状态为active

胖胖学编程

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[hadoop]什么是HA｜普通HDFS和HA的不同｜HA自动故障转移机制

待完成
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。