Zookeeper介绍

最新推荐文章于 2023-06-29 23:27:50 发布

codedot

最新推荐文章于 2023-06-29 23:27:50 发布

阅读量161

点赞数

分类专栏： Zookeeper

原文链接：https://www.cnblogs.com/shanfeng1000/p/12675498.html

版权

Zookeeper 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

百度百科

ZooKeeper是一个分布式的，开放源码的分布式应用程序协调服务，是Google的Chubby一个开源的实现，是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件，提供的功能包括：配置维护、域名服务、分布式同步、组服务等。

我们还是通俗地来认识Zookeeper吧。

先看看我们的12306，前两年，我们会发现，平时使用时基本上没什么问题，但是一到春运，12306就会很卡，网站甚至崩溃，因为流量太大，一台服务器扛不住这么大的压力，毕竟一台服务器的资源是有限的。怎么解决这个问题呢，后人想了很多办法，分布式是其中最有效的一个，既然一台服务器不够，那就两台，三台，甚至更多，这样多个服务器就形成了一个集群，虽然解决了网站的流量压力，但是是却增加了维护的难度，比如这个集群有100台服务器，如果我们要修改其中一个配置，难道我们就要去每台服务器上去改么？当然要另辟新径。Zookeeper是一个分布式的协调服务，它可以很好的解决这样的问题。

一、Zookeeper集群

既然是分布式，必然我们需要多台服务器（当然也可以一台服务器开不同的端口，或者使用虚拟技术，或者使用docker之类的容器），最好是同一网段下，方便服务器之间要可以相互访问。然后在每个服务器上安装Zookeeper，并进行相关配置，这样，这些就形成了一个Zookeeper集群，集群节点之间可以相互连接访问。Zookeeper集群可以进行分布式数据同步，你通过集群的某个节点写入数据，Zookeeper会自动将数据同步到其他节点。

Leader和Follower

假如我们有一个Zookeeper集群，集群中有三台服务器，如果这三台是一样的拥有读写权限，那么会导致读写并发的问题（因为Zookeeper节点数据会同步，假如A、B两节点同时写入，那么C节点是同步取A的数据还是B的数据），因此Zookeeper规定，集群中只能有一个节点拥有写权限，这个节点就是Leader节点，其他的全部都是Follower节点，Follower节点只拥有读权限，而Leader节点拥有读写权限，因此如果应用通过Follower节点写入数据，Follower节点会先将数据转发到Leader节点，再由Leader节点写入。如果集群中没有Leader节点或者Leader节点故障了，那么集群内部会自动通过选举确定新Leader节点（选举算法主要有三个：leaderElection、AuthFastLeaderElection、FastLeaderElection，其中FastLeaderElection 是zookeeper默认的一种算法）。

Zookeeper节点状态一般认为有4个：

LOOKING：表示正在进行选举的节点，处于该状态需要进入选举流程
LEADING：领导者状态，处于该状态的节点说明是角色已经是Leader
FOLLOWING：跟随者状态，表示Leader已经选举出来，当前节点角色是follower
OBSERVER：观察者状态，表明当前节点角色是observer，observer表示不会进入选举，仅仅只是接受选举结果，也就是说不会成为Leader节点，但是是follower节点一样提供服务。

Zookeeper集群中可以是一个节点或者两个节点，但是一般认为，Zookeeper集群中至少需要3个节点，这是因为Zookeeper规定，当集群中达到一半的节点故障时，就表示集群出现故障，将不再对外服务，当正常服务节点超过一半时又会自动恢复服务状态。

一台服务器体现不出Zookeeper的优势，如果故障了，就表示集群故障了
二台服务器时，如果一台发生故障，则故障节点数达到了集群节点数据的一半，也就表示集群故障了
三台服务器时，当两个节点故障时才表示集群故障
四台服务器时，当两个节点故障时才表示集群故障

于是乎，一个节点和两个节点的集群是不允许有故障节点的，而三个和四个节点的集群最多都是只能允许一个节点故障。

一般认为，Zookeeper集群中的节点是奇数，因为2n-1个节点的集群和2n个节点的集群运行的故障节点数都是n，这样2n个节点的集群就可以节省一个节点的开销了。

Znode

Zookeeper维护一个树形结构的数据集合，这个与我们的文件系统路径相似，这个树形结构中的每个节点称为znode节点，从根节点(/)开始，默认情况下，znode节点可以拥有子节点，而且每个znode节点可以保存数据，因此我们开发者可以认为，对Zookeeper的操作其实就是对znode的读写操作。

znode节点可以分为三种：

PERSISTENT：持久节点，即使在创建该特定znode的客户端断开连接后，持久节点仍然存在。默认情况下，除非另有说明，否则所有znode都是持久的。
SEQUENTIAL：临时节点，客户端是连接状态时，临时节点就是有效的。当客户端与ZooKeeper集合断开连接时，临时节点会自动删除。临时节点不允许有子节点。临时节点在leader选举中起着重要作用。
EPHEMERAL：顺序节点，可以是持久的或临时的。当一个新的znode被创建为一个顺序节点时，ZooKeeper通过将10位的序列号附加到原始名称来设置znode的路径，顺序节点在锁定和同步中起重要作用。

或者说znode节点有四种：