文章目录
一、什么是2PC?
两阶段提交(Two-phase Commit, 2PC)算法,经常用来实现分布式事务。
系统包含两类节点:
- 协调者(coordinator)
- 事务参与者(participants,cohorts或workers)
每个节点都会记录操作日志并持久化到非易失性存储介质,即使节点发生故障日志也不会丢失。
二、两阶段执行过程
(1)请求阶段(Prepare Phase)
- 协调者通知事务参与者准备提交或者取消事务,然后进入表决阶段
- 在表决过程中,参与者将告知协调者自己决策:
同意(事务参与者本地执行成功)
取消(事务参与者本地执行失败)
(2)提交阶段(Commit Phase)
1. 二阶段提交算法的前提
(1)在分布式系统中,存在一个节点作为协调者(Coordinator), 其他节点作为参与者(Cohorts), 且节点之间可以进行网络通信
(2)所有节点都采用 预写式日志,且日志被写入后即保持在可靠的存储设备上,即使节点损坏,也不会导致日志数据的消失
(2)所有节点不会永久性损坏,即使损坏,仍然可以恢复
2. 过程
- 协调者将基于第一个阶段的投票结果进行决策:
提交 或者 取消
当且仅当所有的参与者同意提交事务,协调者才通知所有的参与者提交事务
- 参与者在接收到协调者发来的消息后将执行相应的操作
三、两阶段提交协议可能面临两种故障:
(1)事务参与者发生故障
给每个事务设置一个超时时间,如果某个事务参与者一直不响应,到达超时时间后整个事务失败。
(2)协调者发生故障
协调者需要将事务相关信息记录到操作日志并同步到备用协调者,假如协调者发生故障,备用协调者可以接替它完成后续的工作。
如果没有备用协调者,协调者又发生了永久性故障,事务参与者将无法完成事务而一直等待下去。
四、总结
- 两阶段提交协议是阻塞协议
执行过程中需要锁住其他更新,且不能容错
- 两阶段提交性能下降的主要原因:
- 为了防崩溃恢复而做的磁盘I/O(fsync)
- 额外的网络往返开销