Zookeeper----Zookeeper 原理

最新推荐文章于 2023-05-25 23:36:07 发布

XiaodunLP

最新推荐文章于 2023-05-25 23:36:07 发布

阅读量154

点赞数

分类专栏： Zookeeper

本文链接：https://blog.csdn.net/XiaodunLP/article/details/86767087

版权

Zookeeper 专栏收录该内容

9 篇文章 1 订阅

订阅专栏

1、Zookeeper 原理解析

1.1、集群角色描述

1.2、Paxos 算法概述（ZAB 协议）

Paxos 算法是莱斯利•兰伯特（英语：Leslie Lamport）于 1990 年提出的一种基于消息传递且具有高度容错特性的一致性算法。

分布式系统中的节点通信存在两种模型：共享内存（Shared memory）和消息传递（Messages passing）。基于消息传递通信模型的分布式系统，不可避免的会发生以下错误：进程可能会慢、被杀死或者重启，消息可能会延迟、丢失、重复，在基础 Paxos 场景中，先不考虑可能出现消息篡改即拜占庭错误（Byzantine failure，即虽然有可能一个消息被传递了两次，但是绝对不会出现错误的消息）的情况。Paxos 算法解决的问题是在一个可能发生上述异常的分布式系统中如何就某个值达成一致，保证不论发生以上任何异常，都不会破坏决议一致性。

Paxos 算法使用一个希腊故事来描述，在 Paxos 中，存在三种角色，分别为

Proposer（提议者，用来发出提案 proposal），

Acceptor（接受者，可以接受或拒绝提案），

Learner（学习者，学习被选定的提案，当提案被超过半数的 Acceptor 接受后为被批准）。

下面更精确的定义 Paxos 要解决的问题：

1、决议(value)只有在被 proposer 提出后才能被批准

2、在一次 Paxos 算法的执行实例中，只批准(chose)一个 value

3、learner 只能获得被批准(chosen)的 value

ZooKeeper 的选举算法有两种：一种是基于 Basic Paxos（Google Chubby 采用）实现的，另外一种是基于 Fast Paxos（ZooKeeper 采用）算法实现的。系统默认的选举算法为 Fast Paxos。并且 ZooKeeper 在 3.4.0 版本后只保留了 FastLeaderElection 算法。

ZooKeeper 的核心是原子广播，这个机制保证了各个 Server 之间的同步。实现这个机制的协议叫做 ZAB 协议（Zookeeper Atomic BrodCast）。

ZAB 协议有两种模式，它们分别是崩溃恢复模式（选主）和原子广播模式（同步）。

1、当服务启动或者在领导者崩溃后，ZAB 就进入了恢复模式，当领导者被选举出来，且大多数 Server 完成了和 leader 的状态同步以后，恢复模式就结束了。状态同步保证了 leader 和 follower 之间具有相同的系统状态。

2、当 ZooKeeper 集群选举出 leader 同步完状态退出恢复模式之后，便进入了原子广播模式。所有的写请求都被转发给 leader，再由 leader 将更新 proposal 广播给 follower

为了保证事务的顺序一致性，zookeeper 采用了递增的事务 id 号（zxid）来标识事务。所有的提议（proposal）都在被提出的时候加上了 zxid。实现中 zxid 是一个 64 位的数字，它高 32 位是 epoch 用来标识 leader 关系是否改变，每次一个 leader 被选出来，它都会有一个新的 epoch，标识当前属于那个 leader 的统治时期。低 32 位用于递增计数。

这里给大家介绍以下 Basic Paxos 流程：

通过流程分析我们可以得出：要使 Leader 获得多数 Server 的支持，则 Server 总数必须是奇数 2n+1，且存活的 Server 的数目不得少于 n+1。

每个 Server 启动后都会重复以上流程。在恢复模式下，如果是刚从崩溃状态恢复的或者刚启动的 server 还会从磁盘快照中恢复数据和会话信息， zk 会记录事务日志并定期进行快照，方便在恢复时进行状态恢复。

Fast Paxos 流程是在选举过程中，某 Server 首先向所有 Server 提议自己要成为 leader，当其它 Server 收到提议以后，解决 epoch 和 zxid 的冲突，并接受对方的提议，然后向对方发送接受提议完成的消息，重复这个流程，最后一定能选举出 Leader