Zookeeper概述
Zookeeper是什么
Zookeeper是一个分布式服务框架,它经常用来解决分布式应用中经常遇到的一些数据管理问题。
如:统一命名服务,集群管理,分布式应用的配置项管理,等等。
- Zookeeper是一个数据库
- Zookeeper是一个具有文件系统特点的数据库
- Zookeeper是一个解决了数据一致性问题的分布式数据库(CP)
- Zookeeper是一个具有发布订阅功能的分布式数据库
一致性
- 强一致性
- 弱一致性
- 最终一致性
Zookeeper想实现的是强一致性,最终实现的是最终一致性。
CAP
- Consistency: 一致性(强一致性)
- Availability: 可用性
- Partition Tolerance: 分区容错性
一个分布式系统里面,节点组成的网络本来应该是连通的。然而可能因为一些故障,使得有些节点之间不连通了,整个网络就分成了几块区域。数据就散布在了这些不连通的区域中。这就叫分区。
当你一个数据项只在一个节点中保存,那么分区出现后,和这个节点不连通的部分就访问不到这个数据了。这时分区就是无法容忍的。
提高分区容忍性的办法就是一个数据项复制到多个节点上,那么出现分区之后,这一数据项就可能分布到各个区里。容忍性就提高了。
然而,要把数据复制到多个节点,就会带来一致性的问题,就是多个节点上面的数据可能是不一致的。要保证一致,每次写操作就都要等待全部节点写成功,而这等待又会带来可用性的问题。
总的来说就是,数据存在的节点越多,分区容忍性越高,但要复制更新的数据就越多,一致性就越难保证。为了保证一致性,更新所有节点数据所需要的时间就越长,可用性就会降低。
请求类型
- 事务性请求:create,set,delete。会记录事务日志。事务日志中包含
事务id,也即是zxid - 非事务性请求: get exs
角色
- leader
领导者,客户端提供读服务和写服务。Leader在集群中只有一个节点,可以说是老大No.1,是zookeeper集群的中心,负责协调集群中的其他节点。从性能的角度考虑,leader可以选择不接受客户端的连接。 - follower
跟随者,为客户端提供读服务,参与Leader选举过程。 - observer
观察者,为客户端提供读服务,不参与Leader选举过程。可以说Observer是zookeeper集群中最边缘的存在。Observer的主要作用是提高zookeeper集群的读性能。通过leader的介绍我们知道zookeeper的一个写操作是要经过半数以上的Follower确认才能够写成功的。那么当zookeeper集群中的节点越多时,zookeeper的写性能就 越差。为了在提高zookeeper读性能(也就是支持更多的客户端连接)的同时又不影响zookeeper的写性能。