zookeeper是一个开源的分布式的,为分布式框架提供协调服务的Apache项目。
zookeeper工作机制
zookeeper从设计模式角度来理解:是一个基于观察者模式设计的分布式服务管理框架,它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,zookeeper就将负责通知已经在zookeeper上注册的那些观察者做出相应反应。
zookeeper特点
- zookeeper集群中有一个leader,多个follower组成的集群。
- 集群中只要有半数以上的节点存活,zookeeper集群就能正常服务。所以zookeeper适合安装奇数台服务器。
- 全局数据一致,每个server保存一份相同的数据副本,client无论连接到哪个server,数据都是一致的。
- 更新请求顺序执行,来自同一个client的更新请求按期发送顺序依次执行。
- 数据更新原子性,一次数据更新要么成功,要么失败。
- 实时性,在一定时间范围内,client能读到最新数据。
zookeeper数据结构
zookeeper数据模型的结构与unix文件系统很相似,整体上可以看作是一颗树,每个节点称作一个ZNode。每一个ZNode默认能够存储1MB的数据,每个ZNode都可以通过其路径唯一标识。
应用场景
提供的服务包括:统一命名服务、统一配置服务、统一集群管理、服务器节点动态上下线、软负载均衡。
统一命名服务
在分布式环境下,经常需要对应用/服务进行统一命名,便于识别。
统一配置管理
分布式环境下,配置文件同步非常常见。一般要求一个集群中,所有节点的配置信息是一致的,比如kafka集群。
对配置文件修改后,希望快速同步到各个节点上。
配置管理可以交给zookeeper实现。可将配置信息写入zookeeper上的一个Znode。各个客户端服务器监听这个Znode。一旦Znode中的数据被修改,zookeeper将通知各个客户端服务器。
统一集群管理
分布式环境中,实时掌握每个节点的状态是必要的。可以根据节点实时状态做出一些调整。
zookeeper可以实现实时监控节点状态变化。可将节点信息写入zookeeper上的一个ZNode。监听这个ZNode可获取它的实时状态变化。
服务器节点动态上下线
客户端能实时洞察到服务器上下线的变化。
软负载均衡
在zookeeper中记录每台服务器的访问数,让访问量最少的服务器去处理最新的客户端请求。