1.ZooKeeper
1.1. ZooKeeper 概述
Zookeeper 是一个分布式协调服务
的开源框架。主要用来解决分布式集群中应用系统的一致性问题,例如怎样避免同时操作同一数据造成脏读的问题。
ZooKeeper 本质上是一个分布式的小文件存储系统。提供基于类似于文件系统的目录树方式的数据存储,并且可以对树中的节点进行有效管理。从而用来维 护和监控你存储的数据的状态变化。通过监控这些数据状态的变化,从而可以达 到基于数据的集群管理。诸如:统一命名服务、分布式配置管理、分布式消息队列、分布式锁、分布式协调等功能。
1.2. ZooKeeper 特性
全局数据一致、可靠性、顺序性、数据更新原子性、实时性
1.3. ZooKeeper 集群角色
Leader
:事务请求(写操作)的唯一调度和处理者,集群内部各个服务器的调度者。Follower
: 处理客户端非事务(读操作)请求,转发事务请求给 Leader; 参与集群 Leader 选举投票。
此外,针对访问量比较大的 zookeeper 集群,还可新增观察者角色。Observer
:观察 Zookeeper 集群的最新状态变化并将这些状态同步过来。
1.4. ZooKeeper 集群搭建
1.4.1.安装
zookeeper 集群搭建指的是 ZooKeeper 分布式模式安装。通常由2n+1台 servers 组成。这是因为为了保证 Leader 选举(基于 Paxos 算法的实现)能过得到多数的支持,所以 ZooKeeper 集群的数量一般为奇数。
Zookeeper 运行需要 java 环境,所以需要提前安装 jdk,然后下载Zookeeper🔗点击跳转
下载并解压ZooKeeper软件压缩包后,可以看到zk包含以下的文件和目录:
bin目录
:zk的可执行脚本目录,包括zk服务进程,zk客户端,等脚本。其中,.sh是Linux环境下的脚本,.cmd是Windows环境下的脚本。conf目录
:配置文件目录。zoo_sample.cfg为样例配置文件,需要修改为自己的名称,一般为zoo.cfg。log4j.properties为日志配置文件。lib
:zk依赖的包。contrib目录
:一些用于操作zk的工具包。recipes目录
:zk某些用法的代码示例。
如果要想使用 Observer 模式,可在对应节点的配置文件添加如下配置:
peerType=observer
其次,必须在配置文件指定哪些节点被指定为 Observer,如:
server.1:localhost:2181:3181:observer
1.4.2.单机模式
ZooKeeper的安装包括单机模式安装,以及集群模式安装。
上面提到,conf目录
下提供了配置的样例zoo_sample.cfg
,要将zk运行起来,需要将其名称修改为zoo.cfg
。
单机模式较简单,是指只部署一个zk进程,客户端直接与该zk进程进行通信。
在开发测试环境下,通过来说没有较多的物理资源,因此我们常使用单机模式。当然在单台物理机上也可以部署集群模式,但这会增加单台物理机的资源消耗。故在开发环境中,我们一般使用单机模式。
但是要注意,生产环境下不可用单机模式,这是由于无论从系统可靠性还是读写性能,单机模式都不能满足生产的需求。
1.4.2.1.启动
在Windows环境下,直接双击zkServer.cmd即可。
在Linux环境下,进入bin目录,执行命令
./zkServer.sh start
这个命令使得zk服务进程在后台进行。如果想在前台中运行以便查看服务器进程的输出日志,可以通过以下命令运行:
./zkServer.sh start-foreground
执行此命令,可以看到大量详细信息的输出,以便允许查看服务器发生了什么。
使用文本编辑器打开zkServer.cmd
或者zkServer.sh
文件,可以看到其会调用zkEnv.cmd
或者zkEnv.sh
脚本。zkEnv脚本的作用是设置zk运行的一些环境变量,例如配置文件的位置和名称等。
假如启动遇到了一些问题,请点击此处!
1.4.2.3 连接
如果是连接同一台主机上的zk进程,那么直接运行bin/目录
下的zkCli.cmd
(Windows环境下)或者zkCli.sh
(Linux环境下),即可连接上zk。
直接执行zkCli.cmd
或者zkCli.sh
命令默认以主机号 127.0.0.1,端口号 2181
来连接zk,如果要连接不同机器上的zk,可以使用 -server 参数,例如:
bin/zkCli.sh -server 10.10.10.100:2181
1.4.3.集群模式
单机模式的zk进程虽然便于开发与测试,但并不适合在生产环境使用。在生产环境下,我们需要使用集群模式来对zk进行部署。
1.4.3.1.启动
假如我们打算在三台不同的机器 10.10.10.100,10.10.10.120,10.10.10.10058上各部署一个zk进程,以构成一个zk集群。
三个zk进程均使用相同的 zoo.cfg 配置
:
tickTime=2000
dataDir=/home/myname/zookeeper
clientPort=2181
initLimit=5
syncLimit=2
server.1=10.10.10.100:2888:3888
server.2=10.10.10.120:2888:3888
server.3=10.10.10.58:2888:3888
在三台机器dataDir目录( /home/myname/zookeeper 目录)下,分别生成一个myid文件
,其内容分别为1,2,3。然后分别在这三台机器上启动zk进程,这样我们便将zk集群启动了起来。
1.4.3.2.连接
可以使用以下命令来连接一个zk集群:
bin/zkCli.sh -server 10.10.10.100:2181,10.10.10.120:2181,10.10.10.58:2181
成功连接后,可以看到控制台日志输出。
2.数据模型
2.1. ZooKeeper 数据模型
采用树形层次结构,ZooKeeper 树中的每个节点被称为— Znode,和文件系统的目录树一样,ZooKeeper 树中的每个节点可以拥有子节点。 但也有不同之处:
- Znode 兼具文件和目录两种特点
- Znode 具有原子性操作
- Znode 存储数据大小有限制
- Znode 通过路径引用(路径必须是绝对的)
2.2. 数据结构图
图中的每个节点称为一个 Znode。 每个 Znode 由 3 部分组成:
- 1 stat:此为状态信息, 描述该 Znode 的版本, 权限等信息
- 2 data:与该 Znode 关联的数据
- 3 children:该 Znode 下的子节点
2.3. 节点类型
Znode 有两种,分别为临时节点
和永久节点
。 节点的类型在创建时即被确定,并且不能改变。
临时节点:该节点的生命周期依赖于创建它们的会话。一旦会话结束,临时节点将被自动删除,当然可以也可以手动删除。临时节点不允许拥有子节点。
永久节点:该节点的生命周期不依赖于会话,并且