分布式一致性原理、Paxos算法与Zookeeper的ZAB协议、Zookeeper使用场景与在电商系统中的应用

最新推荐文章于 2024-04-22 16:25:02 发布

automationer

最新推荐文章于 2024-04-22 16:25:02 发布

阅读量8.9k

点赞数 3

分类专栏： BDA 文章标签：分布式算法事务 zookeeper

本文链接：https://blog.csdn.net/zhengzhihust/article/details/53456371

版权

BDA 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

分布式一致性原理

1.CAP定理：一个分布式系统不可能同时满足一致性（C），可用性（A）和分区容错性（P）这三个基本需求，最多只能同时满足其中的两项。

2.2PC：
Prepare（投票）；Commit（事务提交），中断Rollback（事务回滚）
优点：原理简单，实现方便
缺点：同步阻塞，单点问题，脑裂（主从数据不一致）、保守（协调者超时机制判断是否要中断事务）等

案例：

1.引申：淘宝TCC 分布式事务框架（Try-Commit-Cancel）
2.应用：交易柔性分布式事务处理框架（Horcrux）。基于 Try-Commit 阶段 RPC 处理；Commit-Failure 与Cancel-Failure 采用超时机制（Activity 表超时处理）；对于 Cancel 与Timeout 采用 Spark Streaming/Storm+MQ+Dubbo 实现异步补偿与回滚。

3.3PC：事务询问（CanCommit）；执行事务预提交（PreCommit）；执行提交（DoCommit），中断 Rollback。

存在问题：协调者故障，或者协调者与参与者之间网络故障，此时通过参与者超时机制，继续提交事务。

优点是降低了参与者的阻塞范围，能够在先单点故障后继续达成一致。

缺点是在参与者接收到预提交消息后，如果网络出现分区，此时协调者所在的节点和参与者无法进行正常的网络通信，在这种情况下，该参与者依然会进行事务提交，这必然出现数据的不一致性。

Paxos描述

参见链接：Paxos定于与描述

ZAB协议

1.ZAB架构设计
Architecture of ZAB – ZooKeeper Atomic Broadcast protocol

2.ZAB 与 Paxos比较
ZAB vs Paxos
ZAB集群机器越多，写性能会有所降低、读性能得到水平扩展。然而基于Paxos实现的Chubby读写相对ZK复杂。
同时ZK的每一个操作都具有隐形事务要求，通过强一致性保证数据节点的数据的顺序性（FIFO）。Paxos协议无法实现多个写操作的顺序性，或者通过串行操作实现，如此则以牺牲效率为代价。

ZooKeeper应用

1.ZK可以实现发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等功能。

发布/订阅模式：
- 在处理自定义事件时，观察者模式和发布/订阅模式经常使用，起初不了解这两个模式的实现时，在网上看一些资料，很多介绍都将两种模式混淆在一起，认为他们是同一个模式、一样的实现。后来看了一些设计模式的书籍，感觉两种模式还是有本质的区别，具体如下：
  - 观察者模式至少需要维护两个对象
    - 顾名思义：有观察者对象，肯定也得有观察者需要关注的目标对象，在观察者模式实习的时候，观察者对象需要定义一个统一的接口，在目标对象发生某些改变时，调用（触发）观察者的对应的方法，通知观察者到底发生了那些变化。
    - 而发布订阅模式，只需要注册订阅器上的一个事，而订阅器发生某些事件，则会触发事件通道里面的函数，触发器并不会关心其他任何对象和任何接口
  - 在实现自定义事件方面我觉得使用发布/订阅模式更为合适，简单、耦合性比较低。使用发布订阅模式时，我们关注那个对象，只需要在这个注册这个对象的对应的事件即可，降低了订阅者和发布者直接的耦合。
负载均衡：
- 本质是利用zookeeper的配置管理功能
- 步骤为：
  - 服务提供者把自己的域名及IP端口的映射注册到zk中
  - 服务消费者通过域名从zk中获取到对应的IP及端口，这个IP及端口有多个，只是获取其中一个
  - 当服务宕机时，对于的域名与IP的对于就会减少一个映射
命名服务：
- Zookeeper 的 Name Service 与 JNDI 能够完成的功能是差不多的，它们都是将有层次的目录结构关联到一定资源上。也许你并不需要将名称关联到特定资源上，你可能只需要一个不会重复名称，就像数据库中产生一个唯一的数字主键一样。
分布式协调/通知：
- 通过watcher的通知机制实现
  - 通过 watcher 实现分布式数据的发布/订阅功能
  - watcher 包括客户端线程，客户端 WatcherManager ， Zookeeper 服务器三个部分
  - 客户端在向 zk 服务器注册 watcher 的同时，会将 watcher对象存储在客户端的WatcherManager 中，当 Zookeeper 服务器端触发 Watcher 事件后，会向客户端发送通知，客户端线程从 WatcherManager 中取出对应的 Watcher 对象来执行回调逻辑。
分布式锁：共享锁，排他锁
- 排他锁（Exclusive Locks）
  - 引申：又成为写锁或独占锁，Java 中使用 synchronized 机制和 JDK5提供的 ReentrantLock 定义锁，数据对一个事务可见。
  - Zookeeper 使用数据节点（ZNode）表示一个锁，即只存在/exclusive_lock/lock。
- 共享锁（Shared Locks）
  - 引申：又成为读锁，数据对所有事务可见。
  - 存在/shard_lock/lock_no1，/shard_lock/lock_no2等多个临时顺序节点
  - 读写请求：
    - 读请求：如果没有比自己序号小的子节点，或者所有比自己序号小的子节点都是读请求，表明自己获取到了共享锁，开始读取逻辑。如果比自己序号小的子节点中有写请求，则进入等待
    - 写请求：如果自己不是序号最小的子节点，则进入等待
    - 如图，可以避免 ZooKeeper 发送节点变更 Watcher 通知给所有机器，即『羊群效应』。
- 分布式事务
案例：

1.引申：基于MQ的分布式事务补偿机制
2.应用：交易和资金对资源回滚不做同步 RPC调用，而是通过MQ（事务 MQ 或 Mysql+Canal+RocketMQ）交互，通过将消息发送到MQ,然后由资源应用自己去监听MQ的事件
集群管理
- 通过管理 zk 临时节点的顺序子节点，实现集群管理
Master选举
- 原理：
  - 服务器争抢创建标志为Master的临时节点
  - 服务器监听标志为Master的临时节点，当监测到节点删除事件后展开新的一轮争抢
  - 某个服务器成功创建则为Master
分布式队列
- 业界参考Alibaba RocketMQ
- FIFO队列：利用zk的共享锁机制实现
- 分布式系统协调：如合并计算结果等

2.ZK可以保证顺序一致性、原子性、单一视图、可靠性、实时性的功能。

3.Zookeeper并发控制

Zookeeper 版本号机制，通过乐观锁进行并发控制
- 乐观锁又成为乐观并发控制，适用于数据并发竞争不大，事务冲突较少的应用中
- 悲观所适用于数据更新竞争十分激烈的场景，如分布式 DB SequenceID 申请
- 乐观锁事务分为三个阶段：数据读取，写入校验，数据写入
- 写入校验阶段是乐观锁的关键，事务会检查数据在读取阶段后是否有其他事务对数据进行过更新，以确保数据更新的一致性。通过 JDK 中的 CAS 乐观锁实现

4.Zookeeper角色

Leader（设计模式：责任链模式）
- 事务请求的唯一调度和处理者，保证集群事务处理的顺序性
- 集群内部各个服务器的调度者
Follower（设计模式：责任链模式）
- 处理客户端非事务请求，转发事务请求给Leader服务器
- 参与事务请求Proposal投票
- 参与Leader选举投票
Observer
- 只提供非事务服务，事务请求（Proposal投票与Leader选举）会转发给Leader服务器
- 用于不影响集群事务处理能力条件下提升集群的非事务处理能力

5.集群间消息通信
6.znode的类型

persistent znode，如/path，只能通过zk的api删除（delete）
ephemeral znode，当创建该节点的客户端崩溃或关闭了与zk的连接时，这个节点就会被删除。
有序节点：一个有序znode节点被分配唯一一个单调递增的整数。

8.zk服务器端运行在两种模式下：独立模式（standalone）和仲裁模式（quorum）。standalone下zk状态无法复制，quorum下会有一组zk服务器，即zk集合，可以进行状态复制。

automationer

关注

3
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
分布式一致性原理、Paxos算法与Zookeeper的ZAB协议、Zookeeper使用场景与在电商系统中的应用

Paxos算法1.CAP定理：一个分布式系统不可能同时满足一致性（C），可用性（A）和分区容错性（P）这三个基本需求，最多只能同时满足其中的两项。2.2PC： Prepare（投票）；Commit（事务提交），中断Rollback（事务回滚）优点：原理简单，实现方便缺点：同步阻塞，单点问题，脑裂（主从数据不一致）、保守（协调者超时机制判断是否要中断事务）等3.3PC：事务询问（CanCom
复制链接

扫一扫