- zookeeper概述
Zookeeper 是一个分布式协调服务的开源框架。 主要用来解决分布式集群中应用系统的一致性问题,例如怎样避免同时操作同一数据造成脏读的问题。ZooKeeper 本质上是一个分布式的小文件存储系统。 提供基于类似于文件系统的目录树方式的数据存储,并且可以对树中的节点进行有效管理。从而用来维护和监控你存储的数据的状态变化。通过监控这些数据状态的变化,从而可以达到基于数据的集群管理。 - zookeeper的角色
ZooKeeper中包含Leader、Follower和Observer三个角色;
Leader:
Zookeeper 集群工作的核心
事务请求(写操作) 的唯一调度和处理者,保证集群事务处理的顺序性;
集群内部各个服务器的调度者。
对于 create, setData, delete 等有写操作的请求,则需要统一转发给leader 处理, leader 需要决定编号、执行操作,这个过程称为一个事务。
Follower:
处理客户端非事务(读操作) 请求,
转发事务请求给 Leader;
参与集群 Leader 选举投票 2n-1台可以做集群投票。
此外,针对访问量比较大的 zookeeper 集群, 还可新增观察者角色。
Observer:
观察者角色,观察 Zookeeper 集群的最新状态变化并将这些状态同步过
来,其对于非事务请求可以进行独立处理,对于事务请求,则会转发给 Leader
服务器进行处理。
不会参与任何形式的投票只提供非事务服务,通常用于在不影响集群事务
处理能力的前提下提升集群的非事务处理能力。
Follower和Observer的区别就是:Observer不参与Leader的选举过程,也不参与写操作的过半写成功策略。 - zookeeper搭建
Zookeeper本身是由Java语言开发的一个相对独立的基础分布式组件,因此,Zookeeper的安装除了需要安装JDK外,不再需要依赖其它环境。
准备三台机器,安装好JDK,设置好hostname,
机器IP hostname
192.168.0.47 bdata01
192.168.0.52 bdata02
192.168.0.53 bdata03
在Zookeeper集群中,若超过半数以上服务节点不可用,才会造成整个服务不可用,所以其集群节点数一般都是至少3个节点以上的奇数个.
选择zookeeper版本,这里安装选择的是cdh版本,版本为 zookeeper-3.4.5-cdh5.14.0, 有需要Apache版本的,可以自行去Apache官网下载,进行安装.安装目录/home/office
将下载好的安装包上传到第一台机器上,即bdata01, 进行解压,tar -zxvf zookeeper-3.4.5-cdh5.14.0.tar.gz
解压后进入zookeeper,创建zkdata目录和logdata目录,并在zkdata目录下创建myid文件,编辑myid文件,写入1,并保存.
进入conf目录,复制zoo_sample.cfg, 并重命名为zoo.cfg.编辑zoo.cfg
主要修改的地方如图中标注.
dataDir=/home/office/zookeeper-3.4.5-cdh5.14.0/zkdata
dataLogDir=/home/office/zookeeper-3.4.5-cdh5.14.0/logdata
autopurge.snapRetainCount=3
autopurge.purgeInterval=1
server.1=bdata01:2888:3888
server.2=bdata02:2888:3888
server.3=bdata03:2888:3888
说明:2181是zookeeper客户端连接端口,2888是从follower连接到leader机器的端口,3888是用来进行leader选举时所用的端口.
将zookeeper发送到bdata02和bdata03上去, 并修改他们的myid文件值,bdata02为2, bdata03为3.
# 分发zookeeper
[root@bdata01 office ]$ scp -r zookeeper-3.4.5-cdh5.14.0/ bdata02:$PWD
[root@bdata01 office ]$ scp -r zookeeper-3.4.5-cdh5.14.0/ bdata03:$PWD
# 修改bdata02 myid文件的值
[root@bdata02 zookeeper-3.4.5-cdh5.14.0 ]$ echo 2 > zkdata/myid
# 修改 bdata03 myid文件的值
[root@bdata03 zookeeper-3.4.5-cdh5.14.0 ]$ echo 3 > zkdata/myid
修改完成后,就可以启动zookeeper,启动脚本是bin目录下的zkServer.sh脚本, 在三台机器的zookeeper根目录下启动,
[root@bdata02 zookeeper-3.4.5-cdh5.14.0 ]$ bin/zkServer.sh start
启动完成后查看状态. [root@bdata02 zookeeper-3.4.5-cdh5.14.0 ]$ bin/zkServer.sh status