Zookeeper概述
Zookeeper是一个分布式协调服务的开源概架,主要用来解决分布式集群中应用系统的一致性问题,例如怎样避免同时操作同一数据造成脏读的问题。
ZooKeeper本质上是一个分布式的小文件存储系统,提供基于类似于文件系统的目录树方式的数据存储,并且可以对树中的节点进行有效管理,从而用来维护和监控你存储的数据的状态变化,通过监控这些数据状态的变化,从而可以达到基于数据的集群管理,诸如:统一命名服务、分布式配置管理、负载均衡、分布式锁、分布式协调等功能。
Zookeeper工作机制
Zookeeper特点
1)Zookeeper:一个领导者(Leader),多个跟随者(Follower)组成的集群
2)集群中只要有半数以上节点存储,Zookeeper集群就能正常服务
3)全局数据一致:每个Server保存一份相同的数据副本,Client无论连接到哪个Server,数据都是一致的
4)可靠性:如果消息被其中一台服务器接收,那么将被所有服务器接收
5)顺序性:更新请求顺序进行,来自同一个Client的更新请求按其发送顺序依次执行
6)数据更新原子性:一次数据更新要么成功(半数以上节点成功),要么失败,不存在中间状态
7)实时性:Zookeeper保证客户端在一定事件间隔范围内获取服务器的更新信息,或则服务器失效的信息
集群的角色
Leader:
Zookeeper集群工作的核心
事务请求(写操作)的唯一调度和处理者,保证集群事务处理的顺序性,集群内各个服务器的调度者;
对于creat,setData,delete等有写操作的请求,则需要统一转发给leader处理。
leader需要决定编号、执行操作,这个过程称为一个事务
Follower:
处理客户端非事务(读操作)请求,转发事务请求给Leader
参与集群Leader选举投票
Observer:对于访问量比较大的集群,可以新增观察者角色
观察者角色,观察Zookeeper集群的最新状态变化并将这些状态同步过来,对于非事务请求可以进行独立处理,对于事务请求,则会转发给 Leader服务器进行处理。
不会参与任何形式的投票只提供非事务服务,通常用于在不影响集群事务处理能力的前提下提升集群的非事务处理能力。
数据结构
Zookeeper数据模型的结构与Unix文件系统很类似,整体上可以看作一棵树,每个节点称作一个ZNode.每一个ZNode默认能够存储1MB的数据,每个ZNode都可以通过其路径唯一标识。
每个ZNode由3部分组成:
stat:此为状态信息,描述znode的版本,权限等信息
data:与znode关联的数据
children:znode下的子节点
Zookeeper安装
1.本地模式安装部署
1.安装前准备
1)安装jdk
2)拷贝Zookeeper安装包到Linux系统下
3)解压到指定目录
[jinghang@hadoop01 software]$ tar -zxvf zookeeper-3.4.10.tar.gz -C /opt/module/
2.配置修改
1)将/opt/module/zookeeper-3.4.10/conf这个路径下的zoo_sample.cfg修改为zoo.cfg
[jinghang@hadoop01 conf]$ mv zoo_sample.cfg zoo.cfg
2)打开zoo.cfg文件,修改dataDir路径
[jinghang@hadoop01 zookeeper-3.4.10]$ vim zoo.cfg
修改如下内容:
dataDir=