namenode的HA实现

HA的namenode主要分为共享editLog机制和ZKFC对namenode状态的控制。

输入图片说明

1.集群中存在多个namenode,这些namenode都有状态,分为active和standby状态。

2.然后各个namenode之间通过共享文件系统存储编辑日志文件。active master将信息写入共享存储系统,而standby master则读取该信息以保持与active master的同步,从而减少切换时间。

3.此外,datanode还需同时向各个namenode发送数据块处理报告。

4.每一个namenode运行着一个轻量级的故障转移控制器ZKFC。用于监视和控制namenode进程。ZKFC是基于Zookeeper实现的,启动的时候会创建HealthMonitor和ActiveStandbyElector这两个组件,创建的同时也会向HealthMonitor和ActiveStandbyElector注册相应的回调方法。

HealthMonitor:主要负责检测NameNode的健康状态,如果检测到NameNode的状态发生变化,会回调ZKFailoverController的相应方法进行自动的主备选举。

ActiveStandbyElector:主要负责完成自动的主备选举,内部封装了Zookeeper的处理逻辑,一旦Zookeeper主备选举完成,会回调ZKFailoverController的相应方法来进行NameNode的主备状态切换。

输入图片说明

1.HealthMonitor初始化完成之后会启动内部的线程来定时调用对应NameNode的HAServiceProtocol RPC接口,对NameNode的健康状态进行检测。

2.HealthMonitor如果检测到NameNode的健康状态发生变化,会回调ZKFailoverController注册的相应方法进行处理。

3.如果ZKFailoverController判断需要进行主备切换,会首先使用ActiveStandbyElector来进行自动的主备选举。

4.ActiveStandbyElector 与 Zookeeper进行交互完成自动的主备选举。

5.ActiveStandbyElector 与Zookeeper进行交互完成自动的主备选举完成后,会回调ZKFailoverController的相应方法来通知当前的NameNode成为主NameNode或备NameNode.

6.ZKFailoverController调用对应NameNode的HAServiceProtocol RPC 接口的方法将NameNode转换为Active状态或Standby状态。

fencing实现: Hadoop公共库中对外提供了两种fenching实现,分别是sshfence和shelllfence(缺省实现) ,其中sshfence是指通过ssh登陆目标Master节点上,使用命令kill将进程杀死(通过tcp端口号定位进程pid,该方法比jps命令更准确);shellfence执行自定义脚本。

判断是否脑裂: 自身故障,它会先删除持久化节点然后再关闭。如果是脑裂的话,它只是临时节点消息,持久化还存在。 所以我们这边可以通过判断持久化节点是否存在,来判断是否是因为自身故障。

转载于:https://my.oschina.net/134596/blog/1647118

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值