学习Hadoop第十八课(Zookeeper)

节课我们一起学习了Hadoop倒排索引功能,这节课我们一起学习Zookeeper集群的搭建。

         首先我们一起来学习什么是Zookeeper,Zookeeper是Google的Chubby一个开源的实现,是Hadoop的分布式协调服务,它包含一个简单的原语集,分布式应用程序可以基于它实现同步服务,配置维护和命名服务等。

        在hadoop2.0中通常由两个NameNode组成,一个处于active状态,另一个处于standby状态。Active NameNode对外提供服务,而Standby NameNode则不对外提供服务,仅同步active namenode的状态,以便能够在它失败时快速进行切换。
        hadoop2.0官方提供了两种HDFS HA的解决方案,一种是NFS,另一种是QJM。这里我们使用简单的QJM。在该方案中,主备NameNode之间通过一组JournalNode同步元数据信息,一条数据只要成功写入多数JournalNode即认为写入成功。通常配置奇数个JournalNode 这里还配置了一个zookeeper集群,用于ZKFC(DFSZKFailoverController)故障转移,当Active NameNode挂掉了,会自动切换Standby NameNode为Active状态。

        所以通过上面的描述,明白为什么Hadoop要用到Zookeeper了,当Active状态的NameNode宕机后,Zookeeper可以自动帮我们实现把备份NameNode切换为Active状态。当然,Zookeeper的功能远不止这一个,它还有数据同步、分布式锁、负载均衡等等强大的功能。下面我们通过图例来说一下Zookeeper在数据同步方面的作用,Zookeeper集群的搭建有个特点就是设备的数量必须是奇数台,像下图就有5台设备作为Zookeeper的集群,之所以搞这么多台机器组成集群来对外提供服务是考虑到了数据的高可靠性,即一台设备宕机后要能够迅速被其它机器所取代,从而提供持续稳定的服务。在奇数台设备当中只有一台设备是“Leader”即领导身份,其它设备都是"Follower"即从属者的身份。Zookeeper集群只要有一半以上的机器正常运行就可以正常提供服务,也就是说,集群允许宕机的数量不能达到机器总量的一半,比如我们拿一个最小的Zookeeper集群来说,从高可靠性还有奇数台两个方面考虑,我们知道集群最少的机器数量是3台,那么这3台组成的集群最大允许的宕机数量是1台,同理,5台组成的集群最大允许的宕机数量是2台,7台组成的集群最大允许的宕机数量是3台等等。我们来说一下数据同步是怎么回事,我们看下图发现有很多Client连向Server,假如第一台Client修改了第一台Server上的某个变量的值,作为Leader的Server能够监测到哪个Server的哪个变量发生了变化,这时Zookeeper会给这个变量加上锁,如果有Client要获取这个变量的值,它就处于等待状态,等这个变量在其它Server之间进行数据的同步完成之后才会返回这个变量的值。

          接下来说一下为什么要用到Zookeeper,下图第一条所说的意思,我举个例子,比如我们有个好几百台设备组成的集群,现在我们要更改一下配置,那么我们要一台一台的去改吗?答案显然不是的,因为那样做太浪费时间,我们可以修改一台设备的配置,然后利用Zookeeper的数据同步功能自动实现在所有其他设备上的同步,这样是不是非常好啊。下图所说的第二条、第三条的意思是,在Zookeeper出现之前公司内部开发程序时往往由于不通用而导致大量的人力物力财力的浪费,而Zookeeper却以高通用性和高可靠性很好的解决了这一问题,使程序的通用性大大提高。

          Zookeeper能帮我们做什么?如下图所示。

        那么Zookeeper的特性是什么呢?如下图所示。之所以说Zookeeper是简单的,是因为我们几乎不用编程,我们只要启动它的服务就可以了,当然它也提供了一些java接口来供我们调用的。说它富有表现力是说它具有非常丰富且强大的功能。高可用性是指Apache在设计该产品之初便考虑了非常多的情况,可以适用于非常多的情况。采用松耦合的交互方式是指采用面向接口编程从而最大限度的降低模块与模块之间的关联。Zookeeper是一个资源库是指它提供服务,你可以让它为你服务,当然也可以不用它,用于不用,它都在那儿。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行程实践、外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值