文章目录
1 Zookeeper选举机制
- Zookeeper选举机制——第一次启动
SID:服务器ID。用来
唯一标识
一台ZooKeeper集群中的机器,每台机器不能重复,和myid一致。
ZXID:事务ID
。ZXID是一个事务ID,用来标识一次服务器状态的变更
。在某一时刻,集群中的每台机器的ZXID值不一定完全一致,这和ZooKeeper服务器对于客户端“更新请求”的处理逻辑有关。
Epoch:每个Leader任期的代号
。没有Leader时同一轮投票过程中的逻辑时钟值是相同的。每投完一次票这个数据就会增加
前提条件:假设我们Zookeeper的集群数量为5
- 服务器1启动,发起一次选举。服务器1投自己一票。此时服务器1票数一票,不够半数以上(3票),选举无法完成,服务器1状态保持为LOOKING;
- 服务器2启动,再发起一次选举。服务器1和2分别投自己一票并交换选票信息:
此时服务器1发现服务器2的myid比自己目前投票推举的(服务器1)大,更改选票为推举服务器2
。此时服务器1票数0票,服务器2票数2票,没有半数以上结果,选举无法完成,服务器1,2状态保持LOOKING - 服务器3启动,发起一次选举。此时服务器1和2都会更改选票为服务器3。此次投票结果:服务器1为0票,服务器2为0票,
服务器3为3票。此时服务器3的票数已经超过半数,服务器3当选Leader。
服务器1,2更改状态为FOLLOWING,服务器3更改状态为LEADING; - 服务器4启动,发起一次选举。此时服务器1,2,3已经不是LOOKING状态,不会更改选票信息。交换选票信息结果:
服务器3为3票,服务器4为1票。此时服务器4服从多数,更改选票信息为服务器3,
并更改状态为FOLLOWING; - 服务器5启动,同4一样当小弟。
- Zookeeper选举机制——非第一次启动
- 当ZooKeeper集群中的一台服务器出现以下两种情况之一时,就会开始进入Leader选举:
•服务器初始化启动。
•服务器运行期间无法和Leader保持连接。
- 而当一台机器进入Leader选举流程时,当前集群也可能会处于以下两种状态:
① 集群中本来就已经存在一个Leader。
对于第一种已经存在Leader的情况,机器试图去选举Leader时,会被告知当前服务器的Leader信息,对于该机器来说,仅仅需要和Leader机器建立连接,并进行状态同步即可。
② 集群中确实不存在Leader
假设ZooKeeper由5台服务器组成,SID分别为1、2、3、4、5,ZXID分别为8、8、8、7、7,并且此时SID为3的服务器是Leader。某一时刻,3和5服务器出现故障,因此开始进行Leader选举。
SID为1、2、4的机器投票情况:
选举Leader规则: ①EPOCH大的直接胜出 ②EPOCH相同,事务id大的胜出 ③事务id相同,服务器id大的胜出
2 客户端命令行操作
2.1 命令行语法
命令基本语法 | 功能描述 |
---|---|
help | 显示所有操作命令 |
ls path | 使用 ls 命令来查看当前 znode 的子节点 [可监听] ( -w 监听子节点变化 -s 附加次级信息) |
create | 普通创建 -s 含有序列 -e 临时(重启或者超时消失) |
get path | 获得节点的值 [可监听] -w 监听节点内容变化 -s 附加次级信息 |
set | 设置节点的具体值 |
stat | 查看节点状态 |
delete | 删除节点 |
deleteall | 递归删除节点 |
启动客户端命令:
[root@zookeeper02 zookeeper3.5.7]# bin/zkCli.sh
2.2 znode节点数据信息
- 查看当前znode中所包含的内容
[zk: localhost:2181(CONNECTED) 1] ls /
[zookeeper]
- 查看当前节点详细数据
[zk: localhost:2181(CONNECTED) 2] ls -s /
[zookeeper]cZxid = 0x0
ctime = Wed Dec 31 19:00:00 EST 1969
mZxid = 0x0
mtime = Wed Dec 31 19:00:00 EST 1969
pZxid = 0x0
cversion = -1
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 0
numChildren = 1
- czxid:创建节点的事务 zxid
每次修改 ZooKeeper 状态都会产生一个 ZooKeeper 事务 ID。事务 ID 是 ZooKeeper 中所有修改总的次序。每次修改都有唯一的 zxid,如果 zxid1 小于 zxid2,那么 zxid1 在 zxid2 之前发生。- ctime:znode 被创建的毫秒数(从 1970 年开始)
- mzxid:znode 最后更新的事务 zxid
- mtime:znode 最后修改的毫秒数(从 1970 年开始)
- pZxid:znode 最后更新的子节点 zxid
- cversion:znode 子节点变化号,znode 子节点修改次数
- dataversion:znode 数据变化号
- aclVersion:znode 访问控制列表的变化号
- ephemeralOwner:如果是临时节点,这个是 znode 拥有者的 session id。如果不是临时节点则是 0。
- dataLength:znode 的数据长度
- numChildren:znode 子节点数量
2.3 节点类型(持久/短暂/有序号/无序号)
持久(Persistent):客户端和服务器端断开连接后,创建的节点不删除
短暂(Ephemeral):客户端和服务器端断开连接后,创建的节点自己删除
说明:创建znode时设置顺序标识,znode名称后会附加一个值,顺序号是一个单调递增的计数器,由父节点维护
注意:在分布式系统中,顺序号可以被用于为所有的事件进行全局排序,这样客户端可以通过顺序号推断事件的顺序
- (1)持久化目录节点
客户端与Zookeeper断开连接后,该节点依旧存在 - (2)持久化顺序编号目录节点
客户端与Zookeeper断开连接后,该节点依旧存在,只是Zookeeper给该节点名称进行顺序编号 - (3)临时目录节点
客户端与Zookeeper断开连接后,该节点被删除 - (4)临时顺序编号目录节点
客户端与 Zookeeper 断开连接后,该节点被删除 ,只是Zookeeper给该节点名称进行顺序编号。
- 分别创建2个普通节点(永久节点 + 不带序号),并获取节点的值
[zk: localhost:2181(CONNECTED) 3] create /sanguo "diaochan"
Created /sanguo
[zk: localhost:2181(CONNECTED) 4] create /sanguo/shuguo "liubei"
Created /sanguo/shuguo
[zk: localhost:2181(CONNECTED) 5] get -s /sanguo
diaochan
cZxid = 0x300000004
ctime = Thu Mar 16 08:36:20 EDT 2023
mZxid = 0x300000004
mtime = Thu Mar 16 08:36:20 EDT 2023
pZxid = 0x300000005
cversion = 1
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 8
numChildren = 1
[zk: localhost:2181(CONNECTED) 6] get -s /sanguo/shuguo
liubei
cZxid = 0x300000005
ctime = Thu Mar 16 08:36:52 EDT 2023
mZxid = 0x300000005
mtime = Thu Mar 16 08:36:52 EDT 2023
pZxid = 0x300000005
cversion = 0
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 6
numChildren = 0
- 创建带序号的节点(永久节点 + 带序号)
[zk: localhost:2181(CONNECTED) 7] create /sanguo/weiguo "caocao"
Created /sanguo/weiguo
[zk: localhost:2181(CONNECTED) 8] create -s /sanguo/weiguo/zhangliao "zhanagliao"
Created /sanguo/weiguo/zhangliao0000000000
[zk: localhost:2181(CONNECTED) 9] create -s /sanguo/weiguo/zhangliao "zhangliao"
Created /sanguo/weiguo/zhangliao0000000001
[zk: localhost:2181(CONNECTED) 10] get -s /sanguo/weiguo/zhangliao000000000
zhangliao0000000000 zhangliao0000000001
[zk: localhost:2181(CONNECTED) 10]
如果原来没有序号节点,序号从 0 开始依次递增。如果原节点下已有 2 个节点,则再排序时从 2 开始,以此类推
- 创建短暂节点(短暂节点 + 不带序号 or 带序号)
- ①. 创建短暂的不带序号的节点
[zk: localhost:2181(CONNECTED) 10] create -e /sanguo/wuguo "zhouyu"
Created /sanguo/wuguo
- ② 创建短暂的带序号的节点
[zk: localhost:2181(CONNECTED) 11] create -e -s /sanguo/wuguo "zhouyu"
Created /sanguo/wuguo0000000003
- ③ 在当前客户端是能查看到的
[zk: localhost:2181(CONNECTED) 12] ls /sanguo
[shuguo, weiguo, wuguo, wuguo0000000003]
- ④ 退出当前客户端然后再重启客户端
[zk: localhost:2181(CONNECTED) 13] quit
[root@zookeeper02 zookeeper3.5.7]# bin/zkCli.sh
- ⑤ 再次查看根目录下短暂节点已经删除
[zk: localhost:2181(CONNECTED) 0] ls /sanguo
[shuguo, weiguo]
- ⑥ 修改节点数据值
[zk: localhost:2181(CONNECTED) 2] set /sanguo/weiguo "simaya"
[zk: localhost:2181(CONNECTED) 3] get /sanguo/weiguo
simaya
2.4 监听器原理
客户端注册监听它关心的目录节点,当目录节点发生变化(数据改变、节点删除、子目录节点增加删除)时,ZooKeeper会通知客户端。监听机制保证ZooKeeper保存的任何的数据的任何改变都能快速的响应到监听了该节点的应用程序。
- 节点的值变化监听
(1)在zookeeper04主机上注册监听/sanguo节点数据变化
[zk: localhost:2181(CONNECTED) 1] get -w /sanguo
(2)在zookeeper03主机上修改/sanguo节点的数据
[zk: localhost:2181(CONNECTED) 2] set /sanguo "xisi"
(3)观察zookeeper04主机收到数据变化的监听
[zk: localhost:2181(CONNECTED) 2]
WATCHER::
WatchedEvent state:SyncConnected type:NodeDataChanged path:/sanguo
注意:在zookeeper03再多次修改/sanguo的值,zookeeper04上不会再收到监听。因为注册一次,只能监听一次。想再次监听,需要再次注册。
- 节点的子节点变化监听(路径变化)
(1)在zookeeper04主机上注册监听/sanguo节点的子节点变化
[zk: localhost:2181(CONNECTED) 2] ls -w /sanguo
[shuguo, weiguo]
(2)在zookeeper03主机/sanguo节点上创建子节点
[zk: localhost:2181(CONNECTED) 3] create /sanguo/jin "simaya"
Created /sanguo/jin
(3)观察zookeeper04主机收到子节点变化的监听
[zk: localhost:2181(CONNECTED) 3]
WATCHER::
WatchedEvent state:SyncConnected type:NodeChildrenChanged path:/sanguo
注意:节点的路径变化,也是注册一次,生效一次。想多次生效,就需要多次注册。
2.5 节点删除与查看
- 删除节点
[zk: localhost:2181(CONNECTED) 7] delete /sanguo/jin
- 递归删除节点
[zk: localhost:2181(CONNECTED) 8] deleteall /sanguo/shuguo
- 查看节点状态
[zk: localhost:2181(CONNECTED) 9] stat /sanguo
cZxid = 0x300000004
ctime = Thu Mar 16 08:36:20 EDT 2023
mZxid = 0x300000010
mtime = Thu Mar 16 09:15:45 EDT 2023
pZxid = 0x300000013
cversion = 9
dataVersion = 1
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 4
numChildren = 1
3 客户端API操作
3.1 Java引入Zookeeper API
- pom.xml文件添加依赖
<dependency>
<groupId>junit</groupId>
<artifactId>junit</artifactId>
<version>RELEASE</version>
</dependency>
<dependency>
<groupId>org.apache.logging.log4j</groupId>
<artifactId>log4j-core</artifactId>
<version>2.8.2</version>
</dependency>
<dependency>
<groupId>org.apache.zookeeper</groupId>
<artifactId>zookeeper</artifactId>
<version>3.5.7</version>
</dependency>
- 添加log4j日志配置
在resources资源目录下创建log4j.properties文件,并加入如下配置:
log4j.rootLogger=INFO, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
log4j.appender.logfile=org.apache.log4j.FileAppender
log4j.appender.logfile.File=target/spring.log
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n
- 创建类ZkClient(包含测试案例)
public class ZkClient {
/**
* 注意:逗号左右不能有空格。并且这里要通过域名的方式才能访问,地址的形式无法连接zookeeper
*/
private String connectString = "zookeeper02:2181,zookeeper03:2181,zookeeper04:2181";
private int sessionTimeout = 2000;
private ZooKeeper zkClient;
@Before
public void init() throws IOException {
zkClient = new ZooKeeper(connectString, sessionTimeout, new Watcher() {
@Override
public void process(WatchedEvent watchedEvent) {
System.out.println("-------------------------------");
List<String> children = null;
try {
children = zkClient.getChildren("/", true);
for (String child : children) {
System.out.println(child);
}
System.out.println("-------------------------------");
} catch (KeeperException e) {
e.printStackTrace();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
});
}
/**
* 创建节点测试案例
*/
@Test
public void create() throws KeeperException, InterruptedException {
// 参数 3:节点权限
// 参数 4:节点的类型
String nodeCreated = zkClient.create("/atguigu", "ss.avi".getBytes(), ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT);
}
/**
* 这个监控貌似只能监控到新增和删除的节点,修改的好像无法监测到
*/
@Test
public void getChildren() throws KeeperException, InterruptedException {
List<String> children = zkClient.getChildren("/", true);
for (String child : children) {
System.out.println(child);
}
// 延时
Thread.sleep(Long.MAX_VALUE);
}
@Test
public void exist() throws KeeperException, InterruptedException {
Stat stat = zkClient.exists("/atguigu", false);
System.out.println(stat == null ? "not exist " : "exist");
}
}
3.2 客户端向服务端写数据流程
- 写流程之写入请求直接发送给Leader节点
- 写流程之写入请求发送给follower节点