一、简介
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务;
从设计模式角度来理解:是一个基于观察者模式设计的分布式服务管理框架;它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据发生变化,zookeeper就负责通知在zookeeper上注册的那些观察者做出相应的反应;
简单来说:zookeeper=文件系统+监听通知机制。
分布式系统
– 多台独立计算机构成
– 计算机之间通过网络进行通信
– 彼此进行交互
– 共同完成同一任务
二、 特点
1、一个leader,多个follower;
2、集群中只要有半数以上节点存活,zookeeper就能正常工作;
3、数据全局一致,每个server保存一份相同的数据副本,client无论连接到哪个server,数据都是一致的;
4、更新请求顺序进行,来自同一个client的更新请求,按照其发送顺序依次执行;
5、数据更新原子性,一次数据更新要么全成功,要么全失败;
6、实时性,在一定时间范围内,client能读到最新的数据;
三、zookeeper数据结构
zookeeper的数据模型结构和unix十分类似,整体上可以看成一棵树,每个节点称作一个ZNode,每个ZNode默认能够存储1MB的数据;每个ZNode都能通过其路径唯一标识;
四、zookeeper应用场景
ZooKeeper服务所管理的是分布式服务间的协同数据,实现通用的协作任务,提供的服务包括:统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下线、软负载均衡等。
ZooKeeper不适合用作海量数据存储,不同的应用有不同的需求,如对一致性和持久性的不同需求,应该将应用数据和协同数据独立开。
ps:kafka使用zookeeper保存集群的元数据信息和消费者信息。
统一命名服务
在分布式环境下,通常需要对应用/服务进行统一命名,便于识别;
例如:IP不容易记住而域名更容易记住。
统一配置管理
1、分布式环境下配置文件同步非常常见。
(1)一般要求一个集群中,所有节点的配置信息是一致的,比如kafka集群;
(2)对配置文件修改后,希望能快速同步到各个节点上;
2、配置管理可交由zookeeper实现
(1)可见配置信息写入zookeeper的ZNode。
(2)各个客户端服务器监听这个ZNode,一旦这个ZNode被修改,zk将通知各个客户端服务器;
统一集群管理
在分布式环境中,实时掌握某个节点的状态是必要的,可根据节点的实时状态做出一些调整;
zookeeper可以实现实时监控节点状态变化:
可见节点信息写入一个ZNode,监听这个ZNode可获取它的实时变化。
服务器动态上下线
客户端能实时洞察到服务器上下线变化。
软负载均衡
在zookeeper中记录每台服务器的访问数,让访问数最少的服务器去处理最新的客户端请求。
五、Zookeeper集群主要角色
Zookeeper集群主要角色有Leader,Learner(Follower,Observer(当服务器增加到一定程度,为了缓解投票的压力增大,所以增加了Observer。)。
leader:为客户端提供写服务,负责进行投票的发起和决议,更新系统状态,事务请求的唯一调度和处理者。
follower:为客户端提供读服务,参与投票,包括事务请求proposal投票和leader选举投票,接收客户端请求,为客户端返回结果。
observe:为客户端提供读服务,不参与任何投票,包括事务请求proposal投票和leader选举投票,同步leader的状态,加快读写速度。