第一章 Zookeeper概述
1.1 概述
Zookeeper是一个开源的分布式的,为分布式应用提供协调服务的Apache项目,Zookeeper是因大数据和作为Dubbo协调服务而被猿类们熟知。
Zookeeper从设计模式角度来理解:是一个基于观察者模式设计的分布式服务管理框架,它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,Zookeeper就将负责通知已经在Zookeeper上注册的那些观察者做出相应的反应,从而实现集群中类似Master/Slave管理模式。
Zookeeper =(类似于Linux的树形结构)文件系统+通知机制
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传
1.2 特点
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传
1)Zookeeper:一个领导者(leader),多个跟随者(follower)组成的集群。
2)Leader负责进行投票的发起和决议,更新系统状态
3)Follower用于接收客户请求并向客户端返回结果,在选举Leader过程中参与投票
4)集群中只要有半数以上节点存活,Zookeeper集群就能正常服务。
5)全局数据一致:每个server保存一份相同的数据副本,client无论连接到哪个server,数据都是一致的。
6)更新请求顺序进行,来自同一个client的更新请求按其发送顺序依次执行。
7)数据更新原子性,一次数据更新要么成功,要么失败。
8)实时性,在一定时间范围内,client能读到最新数据。
1.3 数据结构
ZooKeeper数据模型的结构与Unix文件系统很类似,整体上可以看作是一棵树,每个节点称做一个ZNode。
很显然zookeeper集群自身维护了一套数据结构。这个存储结构是一个树形结构,其上的每一个节点,我们称之为”znode”,每一个znode默认能够存储1MB的数据,每个ZNode都可以通过其路径唯一标识。
1.4 应用场景
这种观察者模式,能提供的服务包括:分布式消息同步和协调机制、服务器节点动态上下线、统一配置管理、负载均衡、集群管理、发布与订阅,数据库切换,分布式日志的收集,分布式锁、队列管理等。
1.4.1统一命名服务
在分布式环境下,经常需要对应用/服务进行统一命名,便于识别。例如:IP不容易记住,而域名容易记住。如下图,假设百度服务器有三台机器,就可以用如下的1:N关系表示。
1.4.2 统一配置管理
1)分布式环境下,配置文件同步非常常见。尤其是要实现CP模型的功能,为了保证一致性,就需要做做配置文件的同步。
(1)一般要求一个集群中,所有节点的配置信息是一致的,比如Kafka集群。
(2)对配置文件修改后,希望能快速同步到各个节点上。
2)配置管理可交由ZooKeeper实现。
(1)可将配置信息写入到Zookeeper上的一个Znode。
(2)各个客户端服务器监听这个Znode节点。
(3)一旦Znode中的数据被修改,ZooKeeper将通知各个客户端服务器。
1.4.3 统一集群管理
1)分布式环境中,实时掌握每个节点的状态是必须的。
(1)可根据节点实时状态做出一些调整。
2)Zookeeper可以实现实时监控节点状态变化
(1)可将节点信息写入ZooKeeper上的一个ZNode。
(2)监听这个ZNode可获取它的实时状态变化。
1.4.4 服务器节点动态上下线
客户端能实时洞察到服务器上下线的变化。
1.4.5 软负载均衡
在Zookeeper中记录每台服务器的访问数,让访问数最少的服务器去处理最新的客户端请求。