Zookeeper简介
Zookeeper是一个分布式协调框架,是Apache Hadoop 的一个子项 目,主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同 步服务、集群管理、分布式应用配置项的管理等。
Zookeeper 核心概念
其实Zookeeper可以理解为是一个用于存储少量数据的基于内存的数据库,主要有如下两个核心的概念:文件系统数据结构+监听通知机制
文件系统数据结构
Zookeeper维护了一个类似文件系统的数据结构,每个子目录都被称作为 znode(目录节点),和文件系统类似,可以自由的增加、删除 znode,在一个znode下增加、删除子znode。
znode四种类型:
1、持久化目录节点(PERSISTENT)
: 客户端与zookeeper断开连接后,该节点依旧存在,只要不手动删除该节点,他将永远存在
2、持久化顺序目录节点(PERSISTENT_SEQUENTIAL)
: 客户端与zookeeper断开连接后,该节点依旧存在,只是Zookeeper给该节点名称进行顺序编号
3、临时目录节点(EPHEMERAL)
: 客户端与zookeeper断开连接后,该节点被删除
4、临时顺序目录节点(EPHEMERAL_SEQUENTIAL)
: 客户端与zookeeper断开连接后,该节点被删除,只是Zookeeper给该节点名称进行顺序编号
3.5.3版本新增的znode类型:
1、Container节点
:( 如果Container节点下面没有子节点,则Container节点 在未来会被Zookeeper自动清除,定时任务默认60s 检查一次)
2、TTL节点
:( 默认禁用,只能通过系统配置 zookeeper.extendedTypesEnabled=true 开启,不稳 定)
事件监听通知机制
客户端可以注册监听它关心的任意节点,以及它的目录节点和递归子目录节点
1、如果注册的是对某个节点的监听,则当这个节点被删除,或者被修改时,对应的客户端将被通知。
2、如果注册的是对某个目录的监听,则当这个目录有子节点被创建,或者有子节点被删除,对应的客户端将被通知。
3、如果注册的是对某个目录的递归子节点进行监听,则当这个目录下面的任意子节点有目录结构的变化,或者根节点有数据变化时,对应的客户端将被通知。
注意:所有的通知都是一次性的,及无论是对节点还是对目录进行的监听,一旦触发,对应的监听即被移除。递归子节点监听是对所有子节点的,所以每个子节点下面的事件同样只会被触发一次。
Zookeeper使用
zookeeper安装
1、配置JAVA环境,检验环境
java ‐version
2、下载解压 zookeeper
wget https://mirror.bit.edu.cn/apache/zookeeper/zookeeper‐3.5.8/apache‐zookeepe r‐3.5.8‐bin.tar.gz
tar ‐zxvf apache‐zookeeper‐3.5.8‐bin.tar.gz
cd apache‐zookeeper‐3.5.8‐bin
3、重命名配置文件 zoo_sample.cfg
cp zoo_sample.cfg zoo.cfg
4、启动zookeeper
# 可以通过 bin/zkServer.sh 来查看都支持哪些参数
bin/zkServer.sh start conf/zoo.cfg
5、检测是否启动成功
echo stat | nc 192.168.109.200 // 前提是配置文件中stat四字命令设置了了白名单
如:3 4lw.commands.whitelist=stat
6、连接服务器
bin/zkCli.sh ‐server ip:port
使用命令行操作zookeeper
1、创建zookeeper节点命令
create [‐s] [‐e] [‐c] [‐t ttl] path [data] [acl]
中括号为可选项,没有则默认创建持久化节点
-s: 顺序节点
-e: 临时节点
-c: 容器节点
-t: 可以给节点添加过期时间,默认禁用,需要通过系统参数启用
不加任何可选参数,创建的就是持久化节点
//创建节点并添加数据
create /test‐node zhangsan
创建子节点:
create /test‐node/test‐sub‐node
创建临时节点:
create ‐e /ephemeral data
创建序号节点,加参数 -s:
create /seq‐parent data // 创建父目录,单纯为了分类,非必须
create ‐s /seq‐parent/ data // 创建顺序节点。顺序节点将再seq‐parent 目录下面,顺序 递增
创建临时顺序节点:
create ‐s ‐e /ephemeral‐node/前缀‐
创建容器节点:
//容器节点主要用来容纳字节点,如果没有给其创建子节点,容器节点和持久化节点一样,
//如果给容器节点创建了子节点,后续又把子节点清空,容器节点也会被zookeeper删除。
create ‐c /container
修改节点数据:
set /test‐node some‐data‐changed
查看节点:
get /test‐node
查看所有子节点信息:
ls /
//查看 /test-node 下面所有的子节点
ls /test-node
//查看递归子节点列表
ls -R
查看节点状态信息:
stat /test‐node
cZxid:创建znode的事务ID(Zxid的值)
mZxid:最后修改znode的事务ID
pZxid:最后添加或删除子节点的事务ID(子节点列表发生变化才会发生改变)
ctime:znode创建时间
mtime:znode最近修改时间。
dataVersion:znode的当前数据版本。
cversion:znode的子节点结果集版本(一个节点的子节点增加、删除都会影响这个 版本)。aclVersion:表 示对此znode的acl版本。
ephemeralOwner:znode是临时znode时,表示znode所有者的 session ID。 如果 znode不是临时znode,则该字段设置为零。
dataLength:znode数据字段的长度。
numChildren:znode的子znode的数量。
查看节点状态信息同时查看数据:
get -s /test‐node
可以根据状态数据中的版本号有并发修改数据实现乐观锁的功能
比如: 客户端首先获取版本信息, get -s /node-test
/test-node 当前的数据版本是 1 , 这时客户端 用 set 命令修改数据的时候可以把版本号带上
如果在执行上面 set命令前, 有人修改了数据,zookeeper 会递增版本号, 这个时候,如果再用 以前的版本号去修改,将会导致修改失败
2、事件监听命令
针对节点的监听:一旦触发事件,对应的注册会立刻被移除,所以事件监听是一次性的
get ‐w /path // 注册监听的同时获取数据
stat ‐w /path // 对节点进行监听,且获取元数据信息
针对目录的监听:
ls ‐w /path
针对递归子目录的监听:
ls ‐R ‐w /path //‐R 区分大小写,一定要用大写
Zookeeper事件类型:
None: 连接建立事件
NodeCreated: 节点创建
NodeDeleted: 节点删除
NodeDataChanged:节点数据变化
NodeChildrenChanged:子节点列表变化
DataWatchRemoved:节点监听被移除
ChildWatchRemoved:子节点监听被移除
Zookeeper 的 ACL 权限控制( Access Control List )
Zookeeper 的ACL 权限控制,可以控制节点的读写操作,保证数据的安全性,Zookeeper ACL 权 限设置分为 3 部分组成,分别是:权限模式(Scheme)、授权对象(ID)、权限信息 (Permission)。最终组成一条例如“scheme: id: permission”格式的 ACL 请求信息。
Scheme(权限模式)
用来设置 ZooKeeper 服务器进行权限验证的方式。ZooKeeper 的权限 验证方式大体分为两种类型:
范围验证:所谓的范围验证就是说 ZooKeeper 可以针对一个 IP 或者一段 IP 地址授予某 种权限。
口令验证:可以理解为用户名密码的方式。
还有一种Super权限模式, Super可以认为是一种特殊的 Digest 认证。具有 Super 权限的客户端 可以对 ZooKeeper 上的任意数据节点进行任意操作。
授权对象(ID)
授权对象就是说我们要把权限赋予谁,如果我们采用 IP 授权模式,使用的授权对象可以是一个 IP 地址或 IP 地址段;而如果使用 Digest 或 Super 方式,则 对应于一个用户名。如果是 World 模式,是授权系统中所有的用户。
权限信息(Permission)
权限就是指我们可以在数据节点上执行的操作种类,如下所示:在 ZooKeeper 中已经定义好的 权限有 5 种:
数据节点(c: create)创建权限,授予权限的对象可以在数据节点下创建子节点;
数据节点(w: wirte)更新权限,授予权限的对象可以更新该数据节点;
数据节点(r: read)读取权限,授予权限的对象可以读取该节点的内容以及子节点的列表信息;
数据节点(d: delete)删除权限,授予权限的对象可以删除该数据节点的子节点;
数据节点(a: admin)管理者权限,授予权限的对象可以对该数据节点体进行 ACL 权限设置。
命令
getAcl://获取某个节点的acl权限信息
setAcl://设置某个节点的acl权限信息
addauth: //输入认证授权信息,相当于注册用户信息,注册时输入明文密码,zk将以密文的形式存储
可以通过系统参数zookeeper.skipACL=yes进行配置,默认是no,可以配置为true, 则配置过的 ACL将不再进行权限检测
ZooKeeper 内存数据和持久化
Zookeeper数据的组织形式为一个类似文件系统的数据结构,而这些数据都是存储在内存中的, 所以我们可以认为,Zookeeper是一个基于内存的小型数据库,DataNode 是Zookeeper存储节点数据的最小单位。
事务日志
针对每一次客户端的事务操作,Zookeeper都会将他们记录到事务日志中,Zookeeper也会将数据变更应用到内存数据库中。我们可以在zookeeper的主配置文件zoo.cfg 中配置内存中 的数据持久化目录,也就是事务日志的存储路径 dataLogDir. 如果没有配置dataLogDir(非必填), 事务日志将存储到dataDir (必填项)目录
数据快照
数据快照用于记录Zookeeper服务器上某一时刻的全量数据,并将其写入到指定的磁盘文件中。 可以通过配置snapCount配置每间隔事务请求个数,生成快照,数据存储在dataDir指定的目录中。快照事务日志文件名为: snapshot.<当时最大事务ID>,日志满了即进行下一次事务日志文件的 创建