Zookeeper总体介绍(阶段一)
一、Zookeeper简介
1、Zookeeper是什么?
Zookeeper是一个分布式协调服务的开源框架,主要用来解决分布式集群中应用系统的一致性问题(数据一致性),例如怎样避免同时操作同一数据造成脏读问题。
Zookeeper本质上是一个分布式的小文件存储系统。提供类似于文件系统的目录树方式的数据存储,并且可以对树种的节点进行有效管理。
Zookeeper提供给客户端监控存储在zk内部数据的功能,从而可以达到基于数据的集群管理。诸如:统一命名服务、分布式配置管理、分布式消息队列、分布式锁、分布式协调等功能。
2、Zookeeper的架构组成
Leader
- Zookeeper集群工作的核心角色
- 集群内部各个服务器的调度者
- 事务请求(写操作)的唯一调度和处理者,保证集群事务处理的顺序性;对于cerate、setData要统一转发给leader处理,leader需要决定编号、执行操作,这个过程称为一个事务
- 非用户指定
Follower
- 处理客户端非事务(读操作)请求
- 转发事务给leader
- 参与2n+1选举(奇数的原因是为了满足选举,还有脑裂后要满足可用节点大于总结点/2的要求)
Observer
- 观察Zookeeper集群的最新状态并将这些状态同步过来,其对于非事务请求可以进行独立处理。对于事务请求,则会转发给Leader。
- 不会参与任何形式的投票,只提供非事务服务,增加并发读的能力。
3、Zookeeper特点
- Zookeeper:一个领导者和多个跟随者组成的集群
- Leader负责进行投票的发起和决议,更新系统状态
- Follower用于接收客户请求并向客户端返回结果,在选举Leader过程中参与投票
- 集群中只要有半数以上节点存活,集群就能正常工作。
- 全局数据一致:每个server保存一份相同的数据副本。client无论连接到哪个server,数据都是一致的。
- 更新请求顺序进行
- 数据更新原子性,一次数据更新要么成功,要么失败。
4、Zookeeper数据结构与监听机制
在Zookeeper中,每一个数据节点都是一个ZNode,所有的节点呈现树型结构,使用/进行分割的路径表示,开发人员可以向这个节点写入数据,也可以在这个节点下面创建节点。
4.1节点类型
节点类型可以分为三大类:
- 持久性节点
- 临时性节点
- 顺序性节点
在开发过程中创建节点的时候可以通过组合生成四中类型的节点:持久节点、持久顺序节点、临时节点、临时顺序节点。 - 持久节点:创建后会一直存在服务器,直到被主动删除。
- 持久顺序节点:和持久节点一样,只是在节点后加一个数字后缀,表示其顺序。
- 临时节点:生命周期与客户端绑定,客户端断开连接后会被删除,并且不能创建子节点。
- 临时顺序节点:和临时节点一样,只是在节点后加一个数字后缀,表示其顺序。
事务ID
在Zookeeper中,事务指的是能改变Zookeeper服务器状态的操作,我们也称之为事务操作或更新操作,一般包括数据节点创建与删除、数据节点内容更新等操作。对于每一个事务请求,Zookeeper都会为其分配一个全局唯一的事务ID,用ZXID表示,通常是一个64位的数字。每一个ZXID对应一次更新操作,从这些ZXID中可以间接地识别出Zookeeper处理这些更新操作请求的全局顺序。
4.2 ZNode存储的内容
- data:ZNode存储的数据信息
- ACL:记录ZNode的访问权限
- child:记录当前节点的子节点
- stat:包含Znode的各种元数据,比如事务ID、版本号、时间戳、大小等等
4.3监听机制
Zookeeper使用Watcher机制实现分布式数据的发布/订阅功能,Zookeeper允许客户端向服务端注册一个Watcher监听,当服务端的一些指定事件触发了这个Watcher,那么Zookeeper就会向指定客户端发送一个事件通知来实现分布式的通知功能。
Zookeeper的Watcher机制主要包括客户端线程、客户端WatcherManager、Zookeeper服务器三部分,具体工作流程为:
- 客户端在向Zookeeper服务器注册的同时,会将Watcher对象存储在客户端的WatcherManager当中
- 当Zookeeper服务器触发Watcher事件后,会向客户端发送通知
- 客户端线程从WatcherManager中取出对应的Watcher对象来执行回调逻辑