HA机制

HA机制确保7*24小时服务不间断,hadoop 2.x的HA涉及HDFS组件,采用内存中保存元数据和共享edits存储。ZKFailoverController在每个NameNode节点监控状态,防止脑裂。通过ViewFS管理的联邦机制,允许多个NameService并存,分散元数据管理,解决大型集群元数据过多问题。
摘要由CSDN通过智能技术生成

HA机制

hadoop2.x
  • hadoop-HA(high available)

    所谓HA,即高可用(7*24小时不中断服务),消除单点故障
    hadoop的HAf分为各个组件的HA机制-----HDFS的HA,Yarn的HA

  • HDFS的HA机制

    • 通过双namenode消除单点故障
    • 双namenode协调工作要点:

    元数据管理方式改变:
    内存中各自保存一份元数据
    共享的edits放在一个文件系统集群中管理(qjournal和nfs两个主流实现)
    两个namenode都可以读取edits,但只有active状态的namenode节点可以做写操作
    HDFS的HA中没有secondarynamenode,元数据合并交给standby namenode进行checkpoint

    需要状态管理模块:
    实现一个zkfailover,常驻在每一个namenodde所在节点
    每一个zkfc负责监控自己所在namenode节点,利用zk进行状态标识,当需要状态切换时,由zkfc负责切换
    stan

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
HDFS的HA(High Availability)机制是为了提供对Hadoop分布式文件系统的高可用性而设计的。HA机制主要通过以下两个关键组件来实现: 1. NameNode HA:在传统的HDFS架构中,NameNode是HDFS的关键组件,负责管理文件系统的命名空间和数据块的元数据。在HA机制中,引入了Active NameNode和Standby NameNode两个角色,以确保高可用性。 - Active NameNode:负责处理客户端的读写请求,并维护文件系统的元数据。它是主要的NameNode角色。 - Standby NameNode:作为备用节点,定期从Active NameNode同步命名空间和元数据。在Active NameNode发生故障时,Standby NameNode可以快速接管成为Active NameNode。 2. JournalNodes:JournalNodes是一组节点,用于存储HDFS的编辑日志。编辑日志记录了对文件系统的所有修改操作。Active NameNode将修改操作写入JournalNodes,并Standby NameNode从JournalNodes读取这些修改操作,以保持与Active NameNode的同步。 HA机制的工作原理如下: 1. 在HA配置中,Active NameNode和Standby NameNode运行在不同的机器上,并且它们共享相同的配置和元数据。 2. 当客户端发起写操作时,Active NameNode处理请求并将修改操作写入本地编辑日志和JournalNodes。 3. Standby NameNode定期从JournalNodes读取编辑日志,并将这些修改操作应用到自己的命名空间和元数据上。 4. Standby NameNode与Active NameNode之间通过心跳机制进行通信,以了解Active NameNode的状态。如果Standby NameNode检测到Active NameNode不可用,它会尝试接管成为新的Active NameNode。 通过NameNode HA机制,HDFS可以实现高可用性,即使在NameNode发生故障时也能保持文件系统的正常运行。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值