zookeeper

最新推荐文章于 2024-09-16 17:56:23 发布

ziwuzu

最新推荐文章于 2024-09-16 17:56:23 发布

阅读量135

点赞数

分类专栏：开源软件文章标签： zookeeper

本文链接：https://blog.csdn.net/ziwuzu/article/details/84569693

版权

开源软件专栏收录该内容

1 篇文章 0 订阅

订阅专栏

zookeeper可以用来管理配置信息，通过通知来广播信息。

https://cwiki.apache.org/confluence/display/ZOOKEEPER/Index

为维护配置信息，命名服务，提供分布式同步机制，提供组服务提供了一套集中式服务。

在分布式系统中，这些服务可能或多或少的被用到。但之前，每次要用到这些服务的时候，自己写一个，总会有这样那样的问题，比如单点问题，竞态条件等，而且写起来麻烦。

zookeeper将这些服务精炼为一个集中协调服务的简单接口。zookeeper是一个分布式的，也是高度可靠的。

它已经提供了一致性，组管理，存活状态协议的实现。所以我们不必自己实现这些。

zookeeper 通过树形的数据节点来支持分布式的进程之间相互协作，这个结构有点像文件系统。但与普通文件系统不同的是，zookeeper提供了高通量，低延迟，高可用性，严格有序的数据服务。zookeeper的命名空间跟Linux的文件系统类似，都是树型的，根目录 “/”。与linux文件系统最大的不同是，zookeeper的每一个节点都有数据。但zookeeper每个节点的数据是有限的。

zookeeper是设计用来存储协作信息的：配置信息，资源定位信息，状态信息的。这种元信息通常只有几字节或几KB。为了防止有人滥用zookeeper来存储大量数据，zookeeper内部有完整性约束：每个节点的数据最多不超过1M。通常情况下数据比这小得多。

zookeeper服务在组成集群的服务器之间是复制的，这些服务器维护一个内存数据树，一个事务日志，一个持久化的数据快照。因为数据是存在内存中的，所以能够提供高通量和低延迟。内存数据库一个缺点是：zookeeper所能维护的数据量大小受限于内存大小。这也是要保持zookeeper中数据量要小的一个原因。

zookeeper服务器之间是互相知晓的，只要大部分服务器可用，那么zookeeper就是可用的。客户端也需要知道zookeeper服务器的列表，以此来创建zookeeper的连接器。

zookeeper客户端只连到单台zookeeper服务器，维护一个TCP连接，通过这个连接来发送请求，接收响应，接收事件。如果连接挂了，客户端会连到另一台服务器。

读请求会被客户端连接的zookeeper服务器直接处理，如果读请求在一个数据节点上注册了一个监听器（watch），那么这个监听器也是被本地服务器所维护的。写请求在返回之前，会转发到其他所有zookeeper服务器，达到数据一致性。而同步请求也会转发到另一台服务器，但不保证所有服务器数据一致。因此读请求的吞吐量倾向于增加服务器，写请求的吞吐量倾向于减少服务器。

顺序性对zookeeper非常重要，差不多到了强迫症的程度。所有的更新有全序关系。zookeeper用数字给每次更新都打了一个戳，用来标识顺序。我们称这个数字为zxid(zookeeper transaction id)。每次更新有个唯一的zxid。读和监听也通过zxid来排序了。读请求的响应会被服务器打个戳，这个戳就是这个服务器收到的最新的zxid。