zookeeper

zookeeper可以用来管理配置信息,通过通知来广播信息。

https://cwiki.apache.org/confluence/display/ZOOKEEPER/Index

 

为维护配置信息,命名服务,提供分布式同步机制,提供组服务提供了一套集中式服务。

 

在分布式系统中,这些服务可能或多或少的被用到。但之前,每次要用到这些服务的时候,自己写一个,总会有这样那样的问题,比如单点问题,竞态条件等,而且写起来麻烦。

 

zookeeper将这些服务精炼为一个集中协调服务的简单接口。zookeeper是一个分布式的,也是高度可靠的。

它已经提供了一致性,组管理,存活状态协议的实现。所以我们不必自己实现这些。

 

zookeeper 通过树形的数据节点来支持分布式的进程之间相互协作,这个结构有点像文件系统。但与普通文件系统不同的是,zookeeper提供了高通量,低延迟,高可用性,严格有序的数据服务。zookeeper的命名空间跟Linux的文件系统类似,都是树型的,根目录 “/”。与linux文件系统最大的不同是,zookeeper的每一个节点都有数据。但zookeeper每个节点的数据是有限的。

 

zookeeper是设计用来存储协作信息的:配置信息,资源定位信息,状态信息的。这种元信息通常只有几字节或几KB。为了防止有人滥用zookeeper来存储大量数据,zookeeper内部有完整性约束:每个节点的数据最多不超过1M。通常情况下数据比这小得多。

 

zookeeper服务在组成集群的服务器之间是复制的,这些服务器维护一个内存数据树,一个事务日志,一个持久化的数据快照。因为数据是存在内存中的,所以能够提供高通量和低延迟。内存数据库一个缺点是:zookeeper所能维护的数据量大小受限于内存大小。这也是要保持zookeeper中数据量要小的一个原因。

 

zookeeper服务器之间是互相知晓的,只要大部分服务器可用,那么zookeeper就是可用的。客户端也需要知道zookeeper服务器的列表,以此来创建zookeeper的连接器。

 

zookeeper客户端只连到单台zookeeper服务器,维护一个TCP连接,通过这个连接来发送请求,接收响应,接收事件。如果连接挂了,客户端会连到另一台服务器。

 

读请求会被客户端连接的zookeeper服务器直接处理,如果读请求在一个数据节点上注册了一个监听器(watch), 那么这个监听器也是被本地服务器所维护的。写请求在返回之前,会转发到其他所有zookeeper服务器,达到数据一致性。而同步请求也会转发到另一台服务器,但不保证所有服务器数据一致。因此读请求的吞吐量倾向于增加服务器,写请求的吞吐量倾向于减少服务器。

 

顺序性对zookeeper非常重要,差不多到了强迫症的程度。所有的更新有全序关系。zookeeper用数字给每次更新都打了一个戳,用来标识顺序。我们称这个数字为zxid(zookeeper transaction id)。每次更新有个唯一的zxid。读和监听也通过zxid来排序了。读请求的响应会被服务器打个戳,这个戳就是这个服务器收到的最新的zxid。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值