能否简单说一下zookeeper内部原理

最新推荐文章于 2022-09-18 23:26:00 发布

程序员麦冬

最新推荐文章于 2022-09-18 23:26:00 发布

阅读量271

点赞数

分类专栏：技术文文章标签：分布式 zookeeper java 大数据 python

本文链接：https://blog.csdn.net/m0_49051691/article/details/107497642

版权

技术文专栏收录该内容

218 篇文章 1 订阅

订阅专栏

一、Zookeeper简单介绍

ZooKeeper是一个分布式的，开放源码的分布式应用程序协调服务，是Google的Chubby一个开源的实现，是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件，提供的功能包括：配置维护、域名服务、分布式同步、组服务等。

二、Zookeeper的工作机制

Zookeeper从设计模式的角度来理解：是一个基于观察者模式的分布式服务管理框架，它负责存储和管理重要的数据，然后接受观察者的注册，一旦这些被观察的数据状态发生变化，Zookeeper就负责通知已经在Zookeeper上注册的那些观察者让他们做出相应的反应。

工作机制原理如下图：
在这里插入图片描述
简单概括：Zookeeper = 文件系统 + 通知机制。

三、Zookeeper特点

【1】Zookeeper是存在一个领导者（Leader）和多个跟随者（Follower）组成的集群。

【2】集群中若存在半数以上的（服务器存活数量必须大于一半，小于等于一半都不行）节点存活，就能正常工作。

【3】数据一致：每个Server保存一份相同的数据副本，Client无论连接到哪一个Server获取的数据都是一样的。

【4】更新请求按发送的顺序依次执行。

【5】数据更新原子性原则，要么一次更新成功，要么失败。

【6】实时性，Client能够读取到最新的数据。

四、Zookeeper的选举机制

【1】半数机制：集群中半数以上的机器存活，集群就可以正常工作，所以Zookeeper适合安装奇数台服务器。

【2】ZooKeeper虽然在配置中没有指定Master和Slave，但是Zookeeper在工作时会有一个节点成为Leader，其他的则为Follower，Leader是通过内部的选举机制临时产生的。

下面场景模拟内部的选举机制：假设有五台服务器，他们的ID分别是1-5。首先从ID为1开始，它进行投票，选择一台服务器为Leader，但是ID为1的服务器是会把这一票投给自己的，所以ID为1的票数为1，但是Leader只有票数超过总数的一半的时候才会产生（这里是总数是五台，其满足大于等于3就可以产生Leader）。所以轮到ID为2的服务器进行投票，当然ID为2的服务器是投自己的，所以ID为2的服务器票数为1，而这个时候ID为1的服务器就把自己的那一票投给ID为2的服务器（ID为1的服务器良心发现），所以这个时候ID为２的服务器票数为２，当然还没有满足票数大于总数的一半（这个场景票数为３才可以当Leader）。轮到ID为３的服务器开始投票，当然它也是自己投给自己，然后ID为１和ID为２的服务器也把自己的票投给IＤ为3的服务器，所以ID为3的服务器票数为3，满足票数大于总数的一半，ID为3的服务器变为Leader，而ID为4和ID为5没办法，只能乖乖被ID为3的服务器领导了。

图解如下：
在这里插入图片描述