Zookeeper 机制&部署，zookeeper节点含义了解，什么是选举机制，如何保证zookeeper 集群读新能提高且不牺牲写，zookeeper集群同步/监听原理

最新推荐文章于 2022-12-03 21:12:31 发布

yidianyidei

最新推荐文章于 2022-12-03 21:12:31 发布

阅读量444

点赞数

分类专栏：从零开始学大数据-Zookeeper

本文链接：https://blog.csdn.net/yidianyidei/article/details/107713775

版权

从零开始学大数据-Zookeeper 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

文章目录

一 Zookeeper 工作机制

Zookeeper是一个开源的分布式的，为分布式应用提供协调服务的Apache项目。

1 ：存数据

2：通知（发生变化进行通知）

Zookeeper==文件系统+通知机制

在这里插入图片描述

数据结构

在这里插入图片描述

特点

1）Zookeeper：一个领导者（leader），多个跟随者（follower）组成的集群。

2）Leader负责进行投票的发起和决议，更新系统状态

3）Follower用于接收客户请求并向客户端返回结果，在选举Leader过程中参与投票

4）集群中只要有半数以上节点存活，Zookeeper集群就能正常服务。

5）全局数据一致：每个server保存一份相同的数据副本，client无论连接到哪个server，数据都是一致的。

**6）**更新请求顺序进行，来自同一个client的更新请求按其发送顺序依次执行。----通过代写队列实现（写操作：要想数据写入服务器，必须这个要大于服务器 zxid，假如已写入是zxid7 如果要写入zxid 为6（而服务器版本是5 ）它会插入到zxid7 前面--------->永远是按zxid 有序排列）

7）数据更新原子性，一次数据更新要么成功，要么失败。

8）实时性，在一定时间范围内，client能读到最新数据。

统一配置管理

在这里插入图片描述

统一集群管理

在这里插入图片描述

二 Zookepper 部署

先将之前搭建好的快照一下

1. 解压
2. 把conf文件夹下配置文件改个名字    cd zookeeper目录 conf
    cp zoo_sample.cfg zoo.cfg
3. 编辑zoo.cfg,配置datadir  cd zookeeper目录 conf
    datadir=/opt/module/zookeeper-3.4.10/zkData
4. 配置集群机器，每台机器分配一个不同的Serverid，将下面的数据放到datadir末尾
server.2(这里数字随便 不要重复就可以)=hadoop102:2888:3888
server.3=hadoop103:2888:3888
server.4=hadoop104:2888:3888
以上配置2，3，4就是Serverid
5. 在zkData文件夹里新建一个myid文件，内容是本机的Serverid  （数字 是几就几 比如 server.2 就是 2）
6. 配置Zookeeper的LogDIR：配置bin/zkEnv.sh文件
    ZOO_LOG_DIR="."改为自定义的日志目录  比如/opt/module/zookeeper-3.4.10/logs
7. bin/zkServer.sh start  -开启zookeeper
8. bin/zkServer.sh stop  -关闭zookeeper
注意：要启动半数以上节点才可以使用Zookeeper

在这里插入图片描述

三 Zookeeper Shell 操作

回顾 zookeeper 工作机制

文件系统（存数据）+通知机制（发生变化通知）

启动

在主机bin 启动 ./zkCli.sh
Zookeeper 自带节点

在这里插入图片描述

客户端命令操作

在这里插入图片描述

ls / watch

然后你创建一个节点会有通知
在这里插入图片描述

观察特点：单次有效（指对一个目录）

-s 创造全局序列号跟文件名无关

在这里插入图片描述

-e 临时节点：关闭即消失（谁创建谁退出就消失）

get 获得节点值/ stat 查看节点状态

get /XXXX stat /XXXX
在这里插入图片描述

文章目录

四 stat结构体

1）czxid- 引起这个znode创建的zxid，创建节点的事务的zxid

每次修改ZooKeeper状态都会收到一个zxid形式的时间戳，也就是ZooKeeper事务ID。

事务ID是ZooKeeper中所有修改总的次序。每个修改都有唯一的zxid，如果zxid1小于zxid2，那么zxid1在zxid2之前发生。

2）ctime - znode被创建的毫秒数(从1970年开始)

3）mzxid - znode最后更新的zxid

4）mtime - znode最后修改的毫秒数(从1970年开始)

5）pZxid-znode最后更新的子节点zxid

6）cversion - znode子节点变化号，znode子节点修改次数

7）dataversion - znode数据变化号

8）aclVersion - znode访问控制列表的变化号

9）ephemeralOwner- 如果是临时节点，这个是znode拥有者的session id。如果不是临时节点则是0。

10）dataLength- znode的数据长度

11）numChildren - znode子节点数量

五节点类型

1）Znode有两种类型：

短暂（ephemeral）：客户端和服务器端断开连接后，创建的节点自动删除

持久（persistent）：客户端和服务器端断开连接后，创建的节点不删除

2）Znode有四种形式的目录节点（默认是persistent ）

（1）持久化目录节点（PERSISTENT）

客户端与zookeeper断开连接后，该节点依旧存在

（2）持久化顺序编号目录节点（PERSISTENT_SEQUENTIAL）

客户端与zookeeper断开连接后，该节点依旧存在，只是Zookeeper给该节点名称进行顺序编号

（3）临时目录节点（EPHEMERAL）

客户端与zookeeper断开连接后，该节点被删除

（4）临时顺序编号目录节点（EPHEMERAL_SEQUENTIAL）

客户端与zookeeper断开连接后，该节点被删除，只是Zookeeper给该节点名称进行顺序编号

3）创建znode时设置顺序标识，znode名称后会附加一个值，顺序号是一个单调递增的计数器，由父节点维护

4）在分布式系统中，顺序号可以被用于为所有的事件进行全局排序，这样客户端可以通过顺序号推断事件的顺序

**监听器原理

在这里插入图片描述

senthread–（由我们客户端像zookeeper 发送信息的子线程）

eventhread —zookeeper 发生变化通知我 ----接受事件变化（是通过event子线程接受然后回调process 方法）

**选举机制

基于帕克索斯（Paxos算法）多数原则------

ZAB 协议分两个部分

1：奔溃恢复（没leader 选leader）

2：正常启数据 (有leader 就干活)

比较谁大：先比较zxid, 再比较myid(选择最新得为leader)

1）半数机制：集群中半数以上机器存活，集群可用。所以zookeeper适合装在奇数台机器上。

2）Zookeeper虽然在配置文件中并没有指定master和slave。但是，zookeeper工作时，是有一个节点为leader，其他则为follower，Leader是通过内部的选举机制临时产生的。

3）以一个简单的例子来说明整个选举的过程。

假设有五台服务器组成的zookeeper集群，它们的id从1-5，同时它们都是最新启动的，也就是没有历史数据，在存放数据量这一点上，都是一样的。假设这些服务器依序启动，来看看会发生什么。

在这里插入图片描述

（1）服务器1启动，此时只有它一台服务器启动了，它发出去的信息没有任何响应，所以它的选举状态一直是LOOKING状态。（处在奔溃恢复状态，在寻找leader）

（2）服务器2启动，它与最开始启动的服务器1进行通信，互相交换自己的选举结果，由于两者都没有历史数据，所以id值较大的服务器2胜出，但是由于没有达到超过半数以上的服务器都同意选举它(这个例子中的半数以上是3)，所以服务器1、2还是继续保持LOOKING状态。

（3）服务器3启动，根据前面的理论分析，服务器3成为服务器1、2、3中的老大，而与上面不同的是，此时有三台服务器选举了它，所以它成为了这次选举的leader。

（4）服务器4启动，根据前面的分析，理论上服务器4应该是服务器1、2、3、4中最大的，但是由于前面已经有半数以上的服务器选举了服务器3，所以它只能接收当小弟的命了。

（5）服务器5启动，同4一样当小弟。

假如有leader zookeeper 集群才能对外提供服务

observer: 监听作用

observer 没有投票权

案例1

1：一个leader 两个follower --在扩展follower 时读新能提大幅提高，写性能大幅下降（原因写入需要“投票”-多数以上都成功才能写入）

为了提高读性能又不牺牲写性能 —扩展observer （写入不参与投票，相当于监听人）

案例2

2：当zookeeper 跨分布在不同数据中心里比如一个dc 中有三台机器搭建zookeeper ,然后 dc2,dc3 也是三台搭建 zookeeper ，那么这样 dc 相当于 leader dc2,dc3 相当于 follower ，，，这时候 dc1里就包含 leader &follower ，而dc2,dc3 都是observer

zookeeper写数据

在这里插入图片描述

写操作：

要想数据写入服务器，必须这个要大于服务器 zxid，假如已写入是zxid7 如果要写入zxid 为6（而服务器版本是5 ）它会插入到zxid7 前面--------->永远是按zxid 有序排列

集群数据同步

案列1

leader 对5台服务器发广播写请求 ----有2个成功 3个失败（遵循帕克索斯多数原则----leader 会撤销这条广播写请求，那么已经返回给leader 可以写的服务器代写队列将会移除要写入的）

案例2

leader 对5台服务器发广播写请求 ----有3个成功 2个失败（因为数据不一致，返回失败的会原地自sha ，不对外提供服务，然后找leader 拉最新数据—奔溃恢复阶段）

六本章重点（*****）

简述zookeeper 的选举机制？

少数服从多数

zookeeper 监听原理是？

在这里插入图片描述

zookeeper 部署方式有哪几种？集群中角色有哪些，集群最少需要几台机器

1 单机（只在本机zkData 下创建自己myid）然后启动，集群模式（在其它机器myid配置对应serverid 一起启动）

2 follower leader，observer

3 3

zookeeper 常用命令

1）启动客户端

[xx@hadoop103 zookeeper-3.4.10]$ bin/zkCli.sh

2）显示所有操作命令

[zk: localhost:2181(CONNECTED) 1] help

3）查看当前znode中所包含的内容

[zk: localhost:2181(CONNECTED) 0] ls /

[zookeeper]

4）查看当前节点数据并能看到更新次数等数据

[zk: localhost:2181(CONNECTED) 1] ls2 /

[zookeeper]

cZxid = 0x0

ctime = Thu Jan 01 08:00:00 CST 1970

mZxid = 0x0

mtime = Thu Jan 01 08:00:00 CST 1970

pZxid = 0x0

cversion = -1

dataVersion = 0

aclVersion = 0

ephemeralOwner = 0x0

dataLength = 0

numChildren = 1

5）创建普通节点

[zk: localhost:2181(CONNECTED) 2] create /app1 "hello app1"

Created /app1



[zk: localhost:2181(CONNECTED) 4] create /app1/server101 "192.168.1.101"

Created /app1/server101

6）获得节点的值

[zk: localhost:2181(CONNECTED) 6] get /app1

hello app1

cZxid = 0x20000000a

ctime = Mon Jul 17 16:08:35 CST 2017

mZxid = 0x20000000a

mtime = Mon Jul 17 16:08:35 CST 2017

pZxid = 0x20000000b

cversion = 1

dataVersion = 0

aclVersion = 0

ephemeralOwner = 0x0

dataLength = 10

numChildren = 1



[zk: localhost:2181(CONNECTED) 8] get /app1/server101

192.168.1.101

cZxid = 0x20000000b

ctime = Mon Jul 17 16:11:04 CST 2017

mZxid = 0x20000000b

mtime = Mon Jul 17 16:11:04 CST 2017

pZxid = 0x20000000b

cversion = 0

dataVersion = 0

aclVersion = 0

ephemeralOwner = 0x0

dataLength = 13

numChildren = 0

7）创建短暂节点

[zk: localhost:2181(CONNECTED) 9] create -e /app-emphemeral 8888



（1）在当前客户端是能查看到的

[zk: localhost:2181(CONNECTED) 10] ls /

[app1, app-emphemeral, zookeeper]



（2）退出当前客户端然后再重启启动客户端

	[zk: localhost:2181(CONNECTED) 12] quit

[atguigu@hadoop104 zookeeper-3.4.10]$ bin/zkCli.sh



（3）再次查看根目录下短暂节点已经删除

	[zk: localhost:2181(CONNECTED) 0] ls /

[app1, zookeeper]

8）创建带序号的节点

（1）先创建一个普通的根节点app2

	[zk: localhost:2181(CONNECTED) 11] create /app2 "app2"



（2）创建带序号的节点

	[zk: localhost:2181(CONNECTED) 13] create -s /app2/aa 888

Created /app2/aa0000000000



[zk: localhost:2181(CONNECTED) 14] create -s /app2/bb 888

Created /app2/bb0000000001



[zk: localhost:2181(CONNECTED) 15] create -s /app2/cc 888

Created /app2/cc0000000002



如果原节点下有1个节点，则再排序时从1开始，以此类推。

[zk: localhost:2181(CONNECTED) 16] create -s /app1/aa 888

Created /app1/aa0000000001

9）修改节点数据值

[zk: localhost:2181(CONNECTED) 2] set /app1 999

10）节点的值变化监听

	（1）在104主机上注册监听/app1节点数据变化

[zk: localhost:2181(CONNECTED) 26] get /app1 watch



	（2）在103主机上修改/app1节点的数据

[zk: localhost:2181(CONNECTED) 5] set /app1  777



	（3）观察104主机收到数据变化的监听

WATCHER::

WatchedEvent state:SyncConnected type:NodeDataChanged path:/app1

11）节点的子节点变化监听（路径变化）

	（1）在104主机上注册监听/app1节点的子节点变化

[zk: localhost:2181(CONNECTED) 1] ls /app1 watch

[aa0000000001, server101]



	（2）在103主机/app1节点上创建子节点

[zk: localhost:2181(CONNECTED) 6] create /app1/bb 666

Created /app1/bb



	（3）观察104主机收到子节点变化的监听

WATCHER::

WatchedEvent state:SyncConnected type:NodeChildrenChanged path:/app1

12）删除节点

[zk: localhost:2181(CONNECTED) 4] delete /app1/bb

13）递归删除节点

[zk: localhost:2181(CONNECTED) 7] rmr /app2

14）查看节点状态

[zk: localhost:2181(CONNECTED) 12] stat /app1

cZxid = 0x20000000a

ctime = Mon Jul 17 16:08:35 CST 2017

mZxid = 0x200000018

mtime = Mon Jul 17 16:54:38 CST 2017

pZxid = 0x20000001c

cversion = 4

dataVersion = 2

aclVersion = 0

ephemeralOwner = 0x0

dataLength = 3

numChildren = 2

yidianyidei

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Zookeeper 机制&部署，zookeeper节点含义了解，什么是选举机制，如何保证zookeeper 集群读新能提高且不牺牲写，zookeeper集群同步/监听原理

文章目录一 Zookeeper 工作机制数据结构特点统一配置管理统一集群管理Zookepper 部署一 Zookeeper 工作机制Zookeeper是一个开源的分布式的，为分布式应用提供协调服务的Apache项目。1 ：存数据2：通知（发生变化进行通知）Zookeeper==文件系统+通知机制数据结构特点1）Zookeeper：一个领导者（leader），多个跟随者（follower）组成的集群。2）Leader负责进行投票的发起和决议，更新系统状态3）Follower用于接收客
复制链接

扫一扫