分布式事务的基础是本地事务,本地事务的ACID分别由什么保证呢?
- A 原子性 由undo log日志保证,它记录了需要回滚的日志信息,事务回滚是撤销已经成功执行的sql
- C 一致性 由其他三大特性保证、程序代码要保证业务上的一致性
- I 隔离性 由MVCC来保证
- D 持久性 由内存、redo log来保证,mysql修改数据同时在内存和redo log记录这次操作,宕机的时候可以从redo log 恢复。
InnoDb redo log 写盘 ,InnoDB事务进入prepare状态。 如果前面prepare成功,binlog写盘,再继续将事务日志持久化到binlog,如果持久化成功,那么InnoDb事务则进入commit状态。(在redo log里面写一个commit记录)
确保事务执行成功的一个重要判断指标就是 在redo log中此事务是否有commit记录。
redolog刷盘会在系统空闲时进行,刷盘策略有0不刷盘,1提交事务时必须刷盘,2先放在缓存适时刷盘
1. 2PC提交协议
- 准备阶段
- 协调者向所有参与者询问是否可以执行提交操作(vote),并开始等待各参与者的响应。
- 参与者执行所有事务操作,并将Undo信息和Redo信息写入日志
- 各参与者响应协调者发起的询问。如果参与者的事务操作实际执行成功,则它返回一个”同意”消息;如果参与者的事务操作实际执行失败,则它返回一个”中止”消息
- 提交阶段
- 当协调者从所有参与者获得的相应消息都为”同意”时:
- 协调者节点向所有参与者节点发出”正式提交(commit)”的请求
- 参与者节点正式完成提交操作,并释放在整个事务期间内占用的资源
- 参与者节点向协调者节点发送”完成”消息
- 协调者节点收到所有参与者节点反馈的”完成”消息后,完成事务
- 如果协调者收到了参与者的失败消息或者超时,直接给每个参与者发送回滚(Rollback)消息:
- 协调者节点向所有参与者节点发出”回滚操作(rollback)”的请求。
- 参与者节点利用之前写入的Undo信息执行回滚,并释放在整个事务期间内占用的资源。
- 参与者节点向协调者节点发送”回滚完成”消息。
- 协调者节点受到所有参与者节点反馈的”回滚完成”消息后,取消事务。
2PC提交协议有什么缺点?
- 【同步阻塞问题】 是同步阻塞协议,占用资源
- 【单点故障】 协调者挂了参与者会一致阻塞下去
- 【数据不一致】网络原因导致部分参与者未接收到提交请求,则会导致数据不一致
2. 3PC提交协议
- CanCommit阶段
- 事务询问:协调者向参与者发送CanCommit请求。询问是否可以执行事务提交操作。然后开始等待参与者的响应。
- 响应反馈:参与者接到CanCommit请求之后,正常情况下,如果其自身认为可以顺利执行事务,则返回Yes响应,并进入预备状态。否则反馈No
- PreCommit阶段
- 假如协调者从所有的参与者获得的反馈都是Yes响应,那么就会执行事务的预执行。
- 发送预提交请求:协调者向参与者发送PreCommit请求,并进入Prepared阶段。
- 事务预提交:参与者接收到PreCommit请求后,会执行事务操作,并将undo和redo信息记录到事务日志中
- 响应反馈:如果参与者成功的执行了事务操作,则返回ACK响应,同时开始等待最终指令
- 假如有任何一个参与者向协调者发送了No响应,或者等待超时之后,协调者都没有接到参与者的响应,那么就执行事务的中断
- 发送中断请求
- 中断事务:参与者收到来自协调者的abort请求之后(或超时之后,仍未收到协调者的请求),执行事务的中断协调者向所有参与者发送abort请求
在PreCommit阶段,如果参与者没能接收到协调者发出的消息,则参与者自行abort
- doCommit阶段
- 执行提交
- 发送提交请求:协调接收到参与者发送的ACK响应,那么他将从预提交状态进入到提交状态。并向所有参与者发送doCommit请求。
- 事务提交:参与者接收到doCommit请求之后,执行正式的事务提交。并在完成事务提交之后释放所有事务资源
- 响应反馈:事务提交完之后,向协调者发送Ack响应。
- 完成事务:协调者接收到所有参与者的ack响应之后,完成事务。
- 中断事务:协调者没有接收到参与者发送的ACK响应(可能是接受者发送的不是ACK响应,也可能响应超时),那么就会执行中断事务
- 发送中断请求 协调者向所有参与者发送abort请求
- 事务回滚:参与者接收到abort请求之后,利用其在阶段二记录的undo信息来执行事务的回滚操作,并在完成回滚之后释放所有的事务资源。
- 反馈结果:参与者完成事务回滚之后,向协调者发送ACK消息
- 中断事务:协调者接收到参与者反馈的ACK消息之后,执行事务的中断。
在doCommit阶段,如果参与者无法及时接收到来自协调者的doCommit或者rebort请求时,会在等待超时之后,会继续进行事务的提交。(其实这个应该是基于概率来决定的,当进入第三阶段时,说明参与者在第二阶段已经收到了PreCommit请求,那么协调者产生PreCommit请求的前提条件是他在第二阶段开始之前,收到所有参与者的CanCommit响应都是Yes。(一旦参与者收到了PreCommit,意味他知道大家其实都同意修改了)所以,一句话概括就是,当进入第三阶段时,由于网络超时等原因,虽然参与者没有收到commit或者abort响应,但是他有理由相信:成功提交的几率很大。 )
2PC和3PC的区别是什么?
1.3pc比2pc多了一个can commit阶段,减少了不必要的资源浪费。因为2pc在第一阶段会占用资源,而3pc在这个阶段不占用资源,只是校验一下sql,如果不能执行,就直接返回,减少了资源占用。
2.引入超时机制。同时在协调者和参与者中都引入超时机制。
-
2pc:只有协调者有超时机制,超时后,发送回滚指令。
-
3pc:协调者和参与者都有超时机制。
-
协调者超时机制: can commit,pre commit中,如果收不到参与者的反馈,则协调者向参与者发送中断指令。
-
参与者超时机制: pre commit阶段,参与者进行中断; do commit阶段,参与者进行提交。|
-
3. TCC(Try-Confirm-Cancel)
- T(Try):业务检查阶段,这阶段主要进行业务校验和检查或者资源预留;也可能是直接进行业务操作。
- C (Confirm):业务确认阶段,这阶段对Try阶段校验过的业务或者预留的资源进行确认。
- C (Cancel):业务回滚阶段,这阶段和上面的C (Confirm)是互斥的,用于释放Try阶段预留的资源或者业务。
撤销和确认操作的执行可能需要重试,因此还需要保证操作的幂等
相对于 2PC、3PC ,TCC 适用的范围更大,但是开发量也更大,毕竟都在业务上实现,而且有时候你会发现这三个方法还真不好写。
4. 消息队列+本地事件表方案
5. 可靠消息服务方案
6. 最大努力通知方案
其他方案
LCN
SEATA