zookeeper原理

现实、太残忍

已于 2022-06-23 21:12:03 修改

阅读量459

点赞数

分类专栏： zookeeper 文章标签： zookeeper java

于 2022-06-23 13:43:48 首次发布

本文链接：https://blog.csdn.net/sumengnan/article/details/125425295

版权

3 篇文章 0 订阅

订阅专栏

一、 zookeeper角色

集群只能有一个leader角色，主要有两个职责：

集群可以有多个follower，follower通过心跳和leader保持连接，只要有两个职责：

集群可以有多个Observer，Observer主要职责：

Observer功能与follower类似，主要区别是Observer无投票权。

zk集群想支持更多的客户端并发操作，只能增加更多的follower节点，但是过多follower会使投票阶段变得复杂，选主时间过长，不利于故障快速恢复。所以引入更多Observer节点。

zab（zookeeper atomic broadcast）即zookeeper原子消息广播协议。该协议通过事务编号zxid保障集群状态的唯一性。zxid单调递增。

（1）Epoch

指当前集群的周期号，集群每次leader变更都会产生一个新的周期号，周期号单调递增。如果leader崩溃恢复后发现自己比当前集群中leader周期号小，则会以follower的角色加入集群

（2）zxid

zxid指zab协议的事务号，它是一个64位数字。低32位存储单调递增的计数器，针对客户端的每个事务请求，计数器都加1。高32位存储leader的周期号epoch，每次选举出一个新leader后高32位加1，之后低32位从0开始重新计数。

什么节点适合当leader？

节点启动时，zk投票给自己
通过socket发送给集群中其他节点（注意：只能由myid大的节点，向myid小的节点连接，反之不能连接，zk代码中会主动断开），进行pk（zxid，myid），然后改票
通过过半机制，即可选举出leader节点，其他为follower节点
新加入的节点直接为follower节点，之后进行数据同步（如果zkid比leader大，则直接回滚）

注意：leader选举时不能提供服务

使用2pc两阶段提交

客户端发送写请求给follower节点时，follower节点不处理写请求，会转发到leader节点。
leader节点首先生成日志zxid并持久化，然后发送给所有follower节点
follower节点持久化日志，之后返回ack。
leader节点while(true)（多线程，每条线程对应一个follower节点）等待ack，如果超过一半ack（过半机制，不包括Observer节点），则进行commit。
所有节点更新database（内存中数据）