Hadoop学习四 2.x介绍

最新推荐文章于 2022-09-19 14:03:46 发布

Hygge_wx

最新推荐文章于 2022-09-19 14:03:46 发布

阅读量584

点赞数

分类专栏： hadoop 文章标签： hadoop 大数据 big data

本文链接：https://blog.csdn.net/wang_1997_xu/article/details/121703295

版权

hadoop 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1、Hadoop 1.x带来问题

1、单点故障

每个群集只有一个NameNode，NameNode存在单点故障（SPOF）。
如果该计算机或进程不可用，则整个群集在整个NameNode重新启动或在另一台计算机上启动之前将不可用
如果发生意外事件（例如机器崩溃），则在操作员重新启动NameNode之前，群集将不可用。
计划内的维护事件，例如NameNode计算机上的软件或硬件升级，将导致群集停机时间的延长

2、水平扩展将来服务器启动的时候，启动速度慢

3、namenode随着业务的增多，内存占用也会越来越多如果namenode内存占满，将无法继续提供服务

4、日志丢失问题

2、Hadoop 2.x解决问题

2.1 Hadoop-HA

1、hadoop2.x启用了主备节点切换模式（1主1备）

2、当主节点出现异常的时候，集群直接将备用节点切换成主节点

要求备用节点马上就要工作
主备节点内存几乎同步有

3、独立的线程对主备节点进行监控健康状态

4、需要有一定的选举机制，帮助我们确定主从关系

5、我们需要实时存储日志的中间件

2.1 Active NameNode

Active NameNode 的功能和原理的NN的功能是一样的

1、接受客户端请求，查询数据块DN信息

2、存储数据的元数据信息

        数据文件：Block：DN的映射关系

3、工作

        启动时：接受DN的block汇报
        运行时：和DN保持心跳(3s,10m30s)

存储介质：完全基于内存

        优点：数据处理效率高
        缺点：数据的持久化(日志edits+快照fsimage)

2.1 Standby NameNode

1、Standby NameNode：NN的备用节点

2、他和主节点做同样的工作，但是它不会发出任何指令

3、存储：数据的元数据信息

        数据文件：Block：DN的映射关系
        它的内存数据和主节点内存数据几乎是一致的

4、工作：

        启动时：接受DN的block汇报
        运行时：和DN保持心跳(3s,10m30s）

5、存储介质：完全基于内存

        优点：数据处理效率高
        缺点：数据的持久化

6、合并日志文件和镜像

        当搭建好集群的时候，格式化主备节点的时候，ANN和SNN都会默认创建

                fsimage_000000000000000

        当我们操作HDFS的时候ANN会产生日志信息

                edits_inprogress_0000000000001

        主节点会将日志文件中新增的数据同步到JournalNode集群上

        所以只需要snn有操作的日志信息，就可以合并fsImage与edits信息,理论上是一直在合并数

                fsimage -->初始化创建
                edits-->从JournalNode集群上定时同步
                只要同步到edits文件，就开始于fsimage合并
                当达到阈值的时候，直接拍摄快照即可

        SNN将合并好的Fsimage发送给ANN，ANN验证无误后，存放到自己的目录中

2.3 JournalNode

1、 Quorum JournalNode Manager 共享存储系统，NameNode通过共享存储系统实现日志数据同步。

2、JournalNode是一个独立的小集群，它的实现原理和Zookeeper的一致( Paxos)

3、ANN产生日志文件的时候，就会同时发送到 JournalNode的集群中每个节点上

4、JournalNode不要求所有的jn节点都接收到日志，只要有半数以上的（n/2+1）节点接受收到日志，那么本条日志就生效

5、SNN每间隔一段时间就去QJM上面取回最新的日志

SNN上的日志有可能不是最新的

6、HA集群的状态正确至关重要，一次只能有一个NameNode处于活动状态。

7、JournalNode只允许单个NameNode成为作者。在故障转移期间，将变为活动状态的NameNode 将承担写入JournalNodes的角色，这将有效地防止另一个NameNode继续处于活动状态，从而使新的Active节点可以安全地进行故障转移。

2.4 ZKFC（Failover Controller故障转移控制器）

对 NameNode 的主备切换进行总体控制，能及时检测到 NameNode 的健康状况，在主 NameNode 故障时借助 Zookeeper 实现自动的主备选举和切换，为了防止因为NN的GC失败导致心跳受影响，ZKFC作为一个deamon进程从NN分离出来

启动时：

当集群启动时，主备节点的概念是很模糊的
当ZKFC只检查到一个节点是健康状态，直接将其设置为主节点
当zkfc检查到两个NN节点是的健康状态，发起投票机制
选出一个主节点，一个备用节点，并修改主备节点的状态

运行时：由 ZKFailoverController、HealthMonitor 和 ActiveStandbyElector 这 3 个组件来协同实现

主备切换 ZKFailoverController启动的时候会创建 HealthMonitor 和 ActiveStandbyElector 这两个主要的内部组件
HealthMonitor 主要负责检测 NameNode 的健康状态
ActiveStandbyElector 主要负责完成自动的主备选举，内部封装了 Zookeeper 的处理逻辑

Hygge_wx

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop学习四 2.x介绍

1、Hadoop 1.x带来问题1、单点故障每个群集只有一个NameNode，NameNode存在单点故障（SPOF）。如果该计算机或进程不可用，则整个群集在整个NameNode重新启动或在另一台计算机上启动之前将不可用如果发生意外事件（例如机器崩溃），则在操作员重新启动NameNode之前，群集将不可用。计划内的维护事件，例如NameNode计算机上的软件或硬件升级，将导致群集停机时间的延长2、水平扩展将来服务器启动的时候，启动速度慢3、namenode随着业务的增多，
复制链接

扫一扫