关于Zookeeper

最新推荐文章于 2022-06-13 21:36:08 发布

qq_33890533

最新推荐文章于 2022-06-13 21:36:08 发布

阅读量208

点赞数

分类专栏：大数据文章标签：大数据 Zookeeper

本文链接：https://blog.csdn.net/qq_33890533/article/details/91604873

版权

大数据专栏收录该内容

12 篇文章 0 订阅

订阅专栏

Zookeeper简介

1.Zookeeper是一个开放源代码的软件。

2.Zookeeper是一个管理“分布式应用程序”的软件。什么是分布式应用程序服务？我们知道，Hadoop中的组件，如hdfs、MapReduce/yarn、hbase、double、kafka都是分布式服务。如MapReduce就是一个分布式服务，MapReduce会将所做的工作分发给Hadoop集群中的多台服务器共同实现。如何对分布式服务做协调，管理这些运行在不同电脑上的任务？就需要一个对分布式应用程序做协调的服务，这就是Zookeeper的工作。

3.Zookeeper可以实现对分布式应用程序做一致性服务，什么是一致性服务？比如我们对A服务器上的一个数据进行了修改，这个数据同时在D服务器和M服务器有两个备份，这时就要对D服务器和M服务器有两个备份都进行修改，这就是一致性服务。Zookeeper就可以实现这么一个一致性服务。

4.Zookeeper实现的强一致性服务。一致性服务分为3类，分别是：

强一致性：a发生变化，b立刻就发生变化
弱一致性：a发生变化，b过一会会发生变化
最终一致性：a发生变化，b最终也会发生变化

Zookeeper可以实现立刻的数据一致性，即强一致性。
大家知道，Hadoop生态系统中的组件，都喜欢起动物的名称。如Hadoop、Hive、Pig等。而Zookeeper中文意思是动物园管理员，就是管理Hadoop生态系统。

5.ZooKeeper的好处
以下是使用ZooKeeper的好处：

简单的分布式协调过程
同步 - 服务器进程之间的相互排斥和协作。此过程有助于Apache HBase进行配置管理。
有序的消息
序列化 - 根据特定规则对数据进行编码。确保应用程序运行一致。这种方法可以在MapReduce中用来协调队列以执行运行的线程。
可靠性
原子性 - 数据转移完全成功或完全失败，但没有事务是部分的。

Zookeeper的选举机制

看看下面的图表。它描述了ZooKeeper的“客户端-服务器架构”。
在这里插入图片描述
配置多个实例共同构成一个Zookeeper集群对外提供服务以达到水平扩展的目的，集群中的每一台电脑都称为服务器(Server)，每个服务器上的数据是相同的，每一个服务器均可以对外提供读和写的服务，这点和redis是相同的，即对客户端来讲每个服务器都是平等的。zookeeper集群一般需要奇数台服务器，为什么是奇数台服务器？因为我们需要通过选举机制选出领导者(leader)，所以必须是奇数台服务器。
Zookeeper提供了三种选举机制：

LeaderElection
AuthFastLeaderElection
FastLeaderElection

默认的算法是FastLeaderElection
客户端(client)是请求发起方。服务器分为不同的角色，有领导者(leader)，也有学习者(learner)。角色的不同是在选举中产生的，下面是选举的流程。
目前有5台服务器，每台服务器均没有数据，它们的编号分别是A,B,C,D,E按编号依次启动，它们的选择举过程如下：

服务器A启动，给自己投票，然后发投票信息，由于其它机器还没有启动所以它收不到反馈信息，服务器A的状态一直属于Looking(选举状态)。
服务器B启动，给自己投票，同时与之前启动的服务器A交换结果，由于服务器B的编号大所以服务器B胜出，但此时投票数没有大于半数，所以两个服务器的状态依然是Looking(选举状态)。
服务器C启动，给自己投票，同时与之前启动的服务器A,B交换信息，由于服务器C的编号最大所以服务器C胜出，此时投票数正好大于半数，所以服务器C成为领导者(Leader)，服务器A,B成为小弟。
服务器D启动，给自己投票，同时与之前启动的服务器A,B,C交换信息，尽管服务器D的编号大，但之前服务器C已经胜出，所以服务器D只能成为小弟。
服务器E启动，后面的逻辑同服务器E成为小弟。

这里的小弟就是学习者(learner)。学习者(learner)分为两类，能够参与投票的就是跟随者(follower)，否则就是观察者(observer)。
服务器有以下状态。

LOOKING：竞选状态。
FOLLOWING：随从状态，同步leader状态，参与投票。
OBSERVING：观察状态，同步leader状态，不参与投票。
LEADING：领导者状态。

下面是选举的简易流程图。
在这里插入图片描述
以下是选举状态图
描述Leader选择过程中的状态变化，这是假设全部实例中均没有数据，假设服务器启动顺序分别为：A,B,C。

Zookeeper的读写机制

在这里插入图片描述
客户端首先和一个Server或者Observer（可以认为是一个Server的代理）通信，发起写请求，然后Server将写请求转发给Leader，Leader再将写请求转发给其他Server，Server在接收到写请求后写入数据并回应Leader，Leader在接收到大多数写成功回应后，认为数据写成功，回应Client。
Zookeeper读取由特定连接的Server在内部执行，因此不需要与集群进行交互。

Zookeeper的数据模型

Zookeeper的数据保存在一个类似于文件系统的一个树形结构中，每个数据节点只能携带少量的数据。为什么只能携带少量的数据呢？因为Zookeeper用于进行协调服务的，所以不需要携带大量数据。
每个数据节点（树中的每一个分支节点或者叶子节点）称之为znode。每一个znode节点既是目录又是文件（是文件的含义是它可以带少量数据，是目录的含义是它有可能还有子目录），这和我们普通看到的文件系统不一样。
在这里插入图片描述

每个目录在zookeeper中叫做znode,并且其有一个唯一的路径标识，如/services/myservice/servers/stuidname1
znode有两种类型，短暂的(ephemeral: 断开连接自己删除)和持久的(ersistent: 断开连接不删除)；
znode可以包含数据和子znode(ephemeral类型的节点不能有子znode)；
znode中的数据可以有多个版本，比如某一个znode下存有多个数据版本，那么查询这个路径下的数据需带上版本；
创建znode时设置顺序标识，znode名称后会附加一个值，顺序号是一个单调递增的计数器，由父节点维护。
如存一个/stu/name值mike，会对路径上加序列化，如/name000001
再存一个/stu/name值jack，会对路径上加序列化，如/name000002 上面的znode就有两个版本
客户端应用可以在znode上设置监视器(Watcher)。
znode不支持部分读写，而是一次性完整读写
znode的类型在创建时确定并且之后不能再修改；
ephemeral znode的客户端会话结束时，zookeeper会将该ephemeral znode删除，ephemeral
znode不可以有子节点；
persistent znode不依赖于客户端会话，只有当客户端明确要删除该persistent znode时才会被删除；

总体来说，Zookeeper的节点有5种ACL(Access Controller List)权限：

CREATE 允许创建Child Nodes
READ 允许获取ZNode的数据，以及该节点的孩子列表
WRITE 可以修改ZNode的数据
DELETE 可以删除一个孩子节点
ADMIN 可以设置权限

这5种权限简写为crwda(即：每个单词的首字符缩写)。注意这5种权限中，delete是指对子节点的删除权限，其它4种权限指对自身节点的操作权限。

qq_33890533

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
关于Zookeeper

Zookeeper简介1.Zookeeper是一个开放源代码的软件。2.Zookeeper是一个管理“分布式应用程序”的软件。什么是分布式应用程序服务？我们知道，Hadoop中的组件，如hdfs、MapReduce/yarn、hbase、double、kafka都是分布式服务。如MapReduce就是一个分布式服务，MapReduce会将所做的工作分发给Hadoop集群中的多台服务器共同实现。...
复制链接

扫一扫