Zookeeper一、Zookeeper特性与节点数据类型

最新推荐文章于 2023-08-09 21:56:26 发布

麦芽糖0219

最新推荐文章于 2023-08-09 21:56:26 发布

阅读量870

点赞数

分类专栏： java 文章标签： zookeeper

本文链接：https://blog.csdn.net/qq_33417321/article/details/119565741

版权

java 专栏收录该内容

88 篇文章 5 订阅

订阅专栏

本文深入解读Zookeeper，介绍了分布式系统基础、Zookeeper的工作原理、核心数据结构、监听机制、ACL权限控制，以及内存数据和持久化的实现。涵盖了节点创建、事件监听、权限管理等关键操作，适合分布式应用开发者参考。

摘要由CSDN通过智能技术生成

一什么是Zookeeper

1.1 分布式系统

在了解Zookeeper之前，需要对分布式相关知识有一定了解，什么是分布式系统呢？通常情况下，单个物理节点很容易达到性能，计算或者容量的瓶颈，所以这个时候就需要多个物理节点来共同完成某项任务，一个分布式系统的本质是分布在不同网络或计算机上的程序组件，彼此通过信息传递来协同工作的系统，而Zookeeper正是一个分布式应用协调框架，在分布式系统架构中有广泛的应用场景。

扩展点：集群与分布式的区别
分布式不一定就是不同的组件，同一个组件也可以，关键在于是否通过交换信息的方式进行协作。比如说Zookeeper的节点都是对等的，但它自己就构成一个分布式系统。也就是说，分布式是指通过网络连接的多个组件，通过交换信息协作而形成的系统。而集群，是指同一种组件的多个实例，形成的逻辑上的整体。可以看出这两个概念并不完全冲突，分布式系统也可以是一个集群，例子就是前面说的zookeeper等，它的特征是服务之间会互相通信协作。是分布式系统不是集群的情况，就是多个不同组件构成的系统；是集群不是分布式系统的情况，比如多个经过负载均衡的HTTP服务器，它们之间不会互相通信。
简单来说就是，集群的各个节点功能都一样，而分布式各个节点功能不一样，需要整体协作才能对外提供服务；

1.2 Zookeeper简介

官方文档上这么解释zookeeper：它是一个分布式协调框架，是Apache Hadoop 的一个子项目，它主要是用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。
在这里插入图片描述

二 Zookeeper核心概念

2.1 文件系统数据结构

Zookeeper维护一个类似文件系统的数据结构：
在这里插入图片描述
每个子目录项都被称作为 znode(目录节点)，和文件系统类似，我们能够自由的增加、删除znode，也可以在一个znode下增加、删除子znode。

有四种类型的znode：
1、PERSISTENT-持久化目录节点
客户端与zookeeper断开连接后，该节点依旧存在，只要不手动删除该节点，他将永远存在

2、 PERSISTENT_SEQUENTIAL-持久化顺序编号目录节点
客户端与zookeeper断开连接后，该节点依旧存在，只是Zookeeper给该节点名称进行顺序编号（编号顺序递增）

3、EPHEMERAL-临时目录节点
客户端与zookeeper断开连接后，该节点被删除, 临时节点不能创建子节点（客户端与服务端的sessionID过期后，就是断开了，这个sessionID过期时间可以配置，通过心跳来判断是否断开）

4、EPHEMERAL_SEQUENTIAL-临时顺序编号目录节点
客户端与zookeeper断开连接后，该节点被删除，只是Zookeeper给该节点名称进行顺序编号, 临时节点不能创建子节点

下边这俩节点类型是3.5.3 版本后新增的

Container 节点
3.5.3 版本新增，如果Container节点下面没有子节点，则Container节点在未来会被Zookeeper自动清除,定时任务默认60s 检查一次

TTL 节点
3.5.3 版本新增，默认禁用，只能通过系统配置 zookeeper.extendedTypesEnabled=true 开启，不稳定
在这里插入图片描述

2.2 监听通知机制

客户端注册监听它关心的任意节点，或者目录节点及递归子目录节点

如果注册的是对某个节点的监听，则当这个节点被删除，或者被修改时，对应的客户端将被通知
如果注册的是对某个目录的监听，则当这个目录有子节点被创建，或者有子节点被删除，对应的客户端将被通知
如果注册的是对某个目录的递归子节点进行监听，则当这个目录下面的任意子节点有目录结构的变化（有子节点被创建，或被删除）或者根节点有数据变化时，对应的客户端将被通知。

注意：所有的通知都是一次性的，及无论是对节点还是对目录进行的监听，一旦触发，对应的监听即被移除。递归子节点，监听是对所有子节点的，所以，每个子节点下面的事件同样只会被触发一次。

2.3 Zookeeper 经典的应用场景

分布式配置中心
分布式注册中心
分布式锁
分布式队列
集群选举
分布式屏障
发布/订阅

三 Zookeeper实操

3.1 zookeeper安装

配置JDK准备好JAVA环境

linux下配置JDK

java -version

下载解压 zookeeper

wget https://mirror.bit.edu.cn/apache/zookeeper/zookeeper-3.5.8/apache-zookeeper-3.5.8-bin.tar.gz
tar -zxvf apache-zookeeper-3.5.8-bin.tar.gz
cd  apache-zookeeper-3.5.8-bin

重命名配置文件 zoo_sample.cfg

 cp zoo_sample.cfg  zoo.cfg

启动zookeeper

# 在bin同级目录下执行下边命令；可以通过 bin/zkServer.sh命令  来查看都支持哪些参数 
./bin/zkServer.sh start conf/zoo.cfg

#关闭Zookeeper
./bin/zkServer.sh stop conf/zoo.cfg

检测是否启动成功

echo stat | nc 192.168.109.200 // 前提是配置文件中中将 stat 四字命令设置了了白名单 如：
4lw.commands.whitelist=stat

zookeeper自带客户端连接服务器

# 连接本机只需要执行./bin/zkCli.sh
./bin/zkCli.sh -server ip:port

3.2 使用客户端命令行操作zookeeper

输入命令 help 查看zookeeper所支持的所有命令（带中括号的是可选参数）：

[zk: localhost:2181(CONNECTED) 80] help
ZooKeeper -server host:port cmd args
	addauth scheme auth
	close 
	config [-c] [-w] [-s]
	connect host:port
	create [-s] [-e] [-c] [-t ttl] path [data] [acl]
	delete [-v version] path
	deleteall path
	delquota [-n|-b] path
	get [-s] [-w] path
	getAcl [-s] path
	history 
	listquota path
	ls [-s] [-w] [-R] path
	ls2 path [watch]
	printwatches on|off
	quit 
	reconfig [-s] [-v version] [[-file path] | [-members serverID=host:port1:port2;port3[,...]*]] | [-add serverId=host:port1:port2;port3[,...]]* [-remove serverId[,...]*]
	redo cmdno
	removewatches path [-c|-d|-a] [-l]
	rmr path
	set [-s] [-v version] path data
	setAcl [-s] [-v version] [-R] path acl
	setquota -n|-b val path
	stat [-w] path
	sync path

3.2.1 创建节点

创建zookeeper 节点命令

create [-s] [-e] [-c] [-t ttl] path [data] [acl]

中括号为可选项，没有则默认创建持久化节点
-s: 顺序节点
-e: 临时节点
-c: 容器节点
-t: ttl节点，可以给节点添加过期时间，默认禁用，需要通过系统参数启用

（-Dzookeeper.extendedTypesEnabled=true,
znode.container.checkIntervalMs : (Java system property only) New in
3.5.1: The time interval in milliseconds for each check of candidate container and ttl nodes. Default is “60000”.)

案例：
创建节点并赋值

# 最后some-data指的是节点里的值
create  /test-node some-data

如上，没有加任何可选参数，创建的就是持久化节点
在这里插入图片描述
查看节点

get  /test-node

在这里插入图片描述
修改节点数据：

注意：只能修改节点数据，不能修改节点名字

set /test-node some-data-changed

在这里插入图片描述
删除节点

delete /test-node

在这里插入图片描述

查看节点状态信息：

stat /test-node

在这里插入图片描述
Stat

cZxid：创建znode的事务ID（Zxid的值）。
mZxid：最后修改znode的事务ID。
pZxid：最后添加或删除子节点的事务ID（子节点列表发生变化才会发生改变）。
ctime：znode创建时间。
mtime：znode最近修改时间。
dataVersion：znode的当前数据版本。
cversion：znode的子节点结果集版本（一个节点的子节点增加、删除都会影响这个版本）。
aclVersion：表示对此znode的acl版本。
ephemeralOwner：znode是临时znode时，表示znode所有者的 session ID。如果znode不是临时znode，则该字段设置为零。
dataLength：znode数据字段的长度。
numChildren：znode的子znode的数量。

查看节点状态信息同时查看数据
在这里插入图片描述
根据状态数据中的版本号有并发修改数据实现乐观锁的功能
比如：客户端首先获取版本信息， get -s /node-test

/test-node 当前的数据版本是 1 ，这时客户端用 set 命令修改数据的时候可以把版本号带上

如果在执行上面 set命令前，有人修改了数据，zookeeper 会递增版本号，这个时候，如果再用以前的版本号去修改，将会导致修改失败，报如下错误
在这里插入图片描述
创建子节点
这里要注意，zookeeper是以节点组织数据的，没有相对路径这么一说，所以，所有的节点一定是以 / 开头

create /test-node/test-sub-node

在这里插入图片描述
查看子节点信息
比如根节点下面的所有子节点，加一个大写 R 可以查看递归子节点列表

ls /

在这里插入图片描述

查看 /test-node 下面所有的子节点
在这里插入图片描述
创建临时节点

create -e /ephemeral data

create 后跟一个 -e 表示创建的是临时节点，临时节点不能创建子节点
在这里插入图片描述
查看临时节点信息

创建序号节点

场景:分布式环境下会使用到（后边会讲）

加参数 -s

create    /seq-parent  data // 创建父目录，单纯为了分类，非必须
create -s /seq-parent/  data // 创建顺序节点。顺序节点将在seq-parent 目录下面，顺序递增

为了容纳子节点，先创建个父目录 /seq-parent
在这里插入图片描述

也可以再序号节点前面带一个前缀
在这里插入图片描述
创建临时顺序节点
增删查改和其他节点无异

create -s -e  /ephemeral-node/前缀-

在这里插入图片描述

创建容器节点

create -c /container

在这里插入图片描述

容器节点主要用来容纳子节点，如果没有给其创建子节点，容器节点表现和持久化节点一样，如果给容器节点创建了子节点，后续又把子节点清空，容器节点也会被zookeeper删除。

给容器节点创建子节点
在这里插入图片描述
创建TTL节点
需要修改配置文件，开启TTL（先关闭zookeeper，修改完再重启）

编辑bin目录下的zkServer.sh文件
在这里插入图片描述
添加如下配置

-Dzookeeper.extendedTypesEnabled=true

在这里插入图片描述
创建TTl节点，设置有效期5秒

5秒后有可能还在，因为是轮询来查看的，可能还没有轮询到

3.2.2 事件监听机制

针对节点的监听
一定事件触发，对应的注册立刻被移除，所以事件监听是一次性的(如果每次都监听，后端服务的压力太大了)

# -w参数是用来监听的
get  -w  /path   // 注册监听的同时获取数据
stat -w /path   // 对节点进行监听，且获取元数据信息

在这里插入图片描述
针对目录的监听
如下图，目录的变化，会触发事件，且一旦触发，对应的监听也会被移除，后续对节点的创建没有触发监听事件

注意：只是对目录结构的变化进行监听，目录里(子)节点的值变化的话是不会监听到的

ls -w /path

在这里插入图片描述
针对递归子目录的监听

# -R 区分大小写，一定用大写 
ls -R -w /path

如下对/test 节点进行递归监听，但是每个目录下的目录监听也是一次性的，如第一次在/test 目录下创建节点时，触发监听事件，第二次则没有，同样，因为是递归的目录监听，所以在/test/sub0下进行节点创建时，触发事件，但是再次创建/test/sub0/subsub1节点时，没有触发事件。
在这里插入图片描述
移除监听事件

Zookeeper事件类型：

        None: 连接建立事件
        NodeCreated： 节点创建
        NodeDeleted： 节点删除
        NodeDataChanged：节点数据变化
        NodeChildrenChanged：子节点列表变化
        DataWatchRemoved：节点监听被移除
        ChildWatchRemoved：子节点监听被移除

四 Zookeeper ACLs权限控制

Zookeeper 的ACL 权限控制,可以控制节点的读写操作,保证数据的安全性，Zookeeper ACL 权限设置分为 3 部分组成，分别是：权限模式（Scheme）、授权对象（ID）、权限信息（Permission）。最终组成一条例如scheme:id:permission格式的 ACL 请求信息。下面我们具体看一下这 3 部分代表什么意思：

4.1 权限组成

4.1.1 Scheme（权限模式）

用来设置 ZooKeeper 服务器进行权限验证的方式。ZooKeeper 的权限验证方式大体分为两种类型：

一种是范围验证。所谓的范围验证就是说 ZooKeeper 可以针对一个 IP 或者一段 IP 地址授予某种权限。比如我们可以让一个 IP 地址为“ip：192.168.0.110”的机器对服务器上的某个数据节点具有写入的权限。或者也可以通过“ip:192.168.0.1/24”给一段 IP 地址的机器赋权。

另一种权限模式就是口令验证，也可以理解为用户名密码的方式。在 ZooKeeper 中这种验证方式是 Digest 认证，而 Digest 这种认证方式首先在客户端传送“username:password”这种形式的权限表示符后，ZooKeeper 服务端会对密码部分使用 SHA-1 和 BASE64 算法进行加密，以保证安全性。

还有一种Super权限模式, Super可以认为是一种特殊的 Digest 认证。具有 Super 权限的客户端可以对 ZooKeeper 上的任意数据节点进行任意操作。

4.1.2 授权对象（ID）

授权对象就是说我们要把权限赋予谁，而对应于 4 种不同的权限模式来说，如果我们选择采用 IP 方式，使用的授权对象可以是一个 IP 地址或 IP 地址段；而如果使用 Digest 或 Super 方式，则对应于一个用户名。如果是 World 模式，是授权系统中所有的用户。

4.1.3 权限信息（Permission）

权限就是指我们可以在数据节点上执行的操作种类，如下所示：在 ZooKeeper 中已经定义好的权限有 5 种：

数据节点（c: create）创建权限，授予权限的对象可以在数据节点下创建子节点；
数据节点（w: wirte）更新权限，授予权限的对象可以更新该数据节点；
数据节点（r: read）读取权限，授予权限的对象可以读取该节点的内容以及子节点的列表信息；
数据节点（d: delete）删除权限，授予权限的对象可以删除该数据节点的子节点；
数据节点（a: admin）管理者权限，授予权限的对象可以对该数据节点体进行 ACL 权限设置。

4.2 权限相关命令

命令：
getAcl：获取某个节点的acl权限信息
setAcl：设置某个节点的acl权限信息
addauth: 输入认证授权信息，相当于注册用户信息，注册时输入明文密码，zk将以密文的形式存储

取消ACL权限校验：
可以通过系统参数zookeeper.skipACL=yes进行配置，默认是no,可以配置为true, 则配置过的ACL将不再进行权限检测

4.3 生成授权ID的两种方式

方式一代码生成ID

@Test
public void generateSuperDigest() throws NoSuchAlgorithmException {
    String sId = DigestAuthenticationProvider.generateDigest("gj:test");
    System.out.println(sId);//  gj:X/NSthOB0fD/OT6iilJ55WJVado=
}

方式二在xshell 中生成

echo -n <user>:<password> | openssl dgst -binary -sha1 | openssl base64

在这里插入图片描述

4.4 设置ACL有两种方式

方式一节点创建的同时设置ACL
create [-s] [-e] [-c] path [data] [acl]

# digest：加密；最后一个参数代表哪些权限，权限类型在4.1.3节里有
create /zk-node datatest digest:gj:X/NSthOB0fD/OT6iilJ55WJVado=:cdrwa

授权后，只有指定的用户才能访问，需要先登录指定用户，下边有讲如何添加授权信息进行登录

方式二或者用setAcl 设置

setAcl /zk-node  digest:gj:X/NSthOB0fD/OT6iilJ55WJVado=:cdrwa

添加授权信息后，不能直接访问，直接访问将报如下异常

get /zk-node
异常信息:
org.apache.zookeeper.KeeperException$NoAuthException: KeeperErrorCode = NoAuth for /zk-node

授权以后，访问之前需要添加授权信息才能访问

添加授权方式一：

addauth digest gj:test
get /zk-node
datatest

添加授权方式二：auth 明文授权
使用之前需要先addauth digest username:password 注册用户信息，后续可以直接用明文授权
如：

addauth digest u100:p100
create /node-1 node1data auth:u100:p100:cdwra
# 这时u100用户授权信息会被zk保存，可以认为当前的授权用户为u100
get /node-1
node1data

添加授权方式三： IP授权模式

setAcl /node-ip ip:192.168.109.128:cdwra
create /node-ip  data  ip:192.168.109.128:cdwra

多个指定IP可以通过逗号分隔，如 setAcl /node-ip ip:IP1:rw,ip:IP2:a

添加授权方式四：Super 超级管理员模式
这是一种特殊的Digest模式，在Super模式下超级管理员用户可以对Zookeeper上的节点进行任何的操作。
需要在启动了上通过JVM 系统参数开启：

DigestAuthenticationProvider中定义（super指的是用户名）
-Dzookeeper.DigestAuthenticationProvider.superDigest=super:<base64encoded(SHA1(password))

在这里插入图片描述

五 ZooKeeper 内存数据和持久化

Zookeeper数据的组织形式为一个类似文件系统的数据结构，而这些数据都是存储在内存中的，所以我们可以认为，Zookeeper是一个基于内存的小型数据库

5.1 内存中的数据

public class DataTree {
   //参数String指的是路径，DataNode指的是节点
    private final ConcurrentHashMap<String, DataNode> nodes =
        new ConcurrentHashMap<String, DataNode>();
        
    private final WatchManager dataWatches = new WatchManager();
    private final WatchManager childWatches = new WatchManager();

DataNode 是Zookeeper存储节点数据的最小单位

public class DataNode implements Record {
    byte data[];
    Long acl;
    public StatPersisted stat;
    private Set<String> children = null;

5.2 事务日志

针对每一次客户端的事务操作，Zookeeper都会将他们记录到事务日志中，当然，Zookeeper也会将数据变更应用到内存数据库中。我们可以在zookeeper的主配置文件zoo.cfg 中配置内存中的数据持久化目录，也就是事务日志的存储路径 dataLogDir. 如果没有配置dataLogDir（非必填）, 事务日志将存储到dataDir （必填项）目录，
zookeeper提供了格式化工具可以进行数据查看事务日志数据
org.apache.zookeeper.server.LogFormatter

java -classpath .:slf4j-api-1.7.25.jar:zookeeper-3.5.8.jar:zookeeper-jute-3.5.8.jar org.apache.zookeeper.server.LogFormatter /usr/local/zookeeper/apache-zookeeper-3.5.8-bin/data/version-2/log.1

如下是我本地的日志文件格式化效果
在这里插入图片描述
从左到右分别记录了操作时间，客户端会话ID，CXID,ZXID,操作类型，节点路径，节点数据（用#+ascii 码表示），节点版本。

Zookeeper进行事务日志文件操作的时候会频繁进行磁盘IO操作，事务日志的不断追加写操作会触发底层磁盘IO为文件开辟新的磁盘块，即磁盘Seek。因此，为了提升磁盘IO的效率，Zookeeper在创建事务日志文件的时候就进行文件空间的预分配- 即在创建文件的时候，就向操作系统申请一块大一点的磁盘块。这个预分配的磁盘大小可以通过系统参数 zookeeper.preAllocSize 进行配置。

事务日志文件名为： log.<当时最大事务ID>，应为日志文件时顺序写入的，所以这个最大事务ID也将是整个事务日志文件中，最小的事务ID，日志满了即进行下一次事务日志文件的创建

5.3 数据快照

数据快照用于记录Zookeeper服务器上某一时刻的全量数据，并将其写入到指定的磁盘文件中。

可以通过配置snapCount配置每间隔事务请求个数，生成快照，数据存储在dataDir 指定的目录;

可以通过如下方式进行查看快照数据（为了避免集群中所有机器在同一时间进行快照，实际的快照生成时机为事务数达到 [snapCount/2 + 随机数(随机数范围为1 ~ snapCount/2 )] 个数时开始快照）
在这里插入图片描述
快照事务日志文件名为： snapshot.<当时最大事务ID>，日志满了即进行下一次事务日志文件的创建