RocketMq实现分布式事务原理

最新推荐文章于 2024-04-25 17:06:19 发布

ningmengbaby

最新推荐文章于 2024-04-25 17:06:19 发布

阅读量72

点赞数

文章标签：分布式

原文链接：https://www.cnblogs.com/qdhxhz/p/11191399.html

版权

举个分布式事务场景

基础概念

分布式事务交互流程

举个分布式事务场景

假设A给B转100块钱，A和B不是同一个服务

目标：A-100,B+100

实际情况有4种

1.就是A账户减100 （成功），B账户加100 （成功）

2.就是A账户减100（失败），B账户加100 （失败）

3.就是A账户减100（成功），B账户加100 （失败）

4.就是A账户减100 （失败），B账户加100 （成功）

这里 1和2种情况是能够保证事务的一致性的，但是 3和4是无法保证事务的一致性的。

基础概念

最终一致性

RocketMq是一种最终一致性的分布式事务，本质上就是两阶段提交

Half Message(半消息)

是指不能被Consumer消费的消息。Producer已经把消息成功发送到了Broker端，但是此消息被标记为暂不能投递状态，处于该种状态下的消息称为半消息。需要 Producer对消息的二次确认后，Consumer才能去消费它。

消息回查

由于网络闪段，生产者应用重启等原因。导致 Producer 端一直没有对 HalfMessage(半消息) 进行 二次确认。这是Brock服务器会定时扫描长期处于半消息的消息，会主动询问 Producer端该消息的最终状态(Commit或者Rollback),该消息即为 消息回查。

分布式事务交互流程

1、A服务先发送个Half Message给Brock端，消息中携带 B服务即将要+100元的信息。

2、当A服务知道Half Message发送成功后，那么开始第3步执行本地事务。

3、执行本地事务(会有三种情况1、执行成功。2、执行失败。3、网络等原因导致没有响应)

4.1)、如果本地事务成功，那么Product像Brock服务器发送Commit,这样B服务就可以消费该message。

4.2)、如果本地事务失败，那么Product像Brock服务器发送Rollback,那么就会直接删除上面这条半消息。

4.3)、如果因为网络等原因迟迟没有返回失败还是成功，那么会执行RocketMQ的回调接口,来进行事务的回查。

从上面流程可以得知 只有A服务本地事务执行成功，B服务才能消费该message。

然后我们再来思考几个问题？

为什么要先发送Half Message(半消息)

我觉得主要有两点

1）可以先确认 Broker服务器是否正常 ，如果半消息都发送失败了 那说明Broker挂了。

2）可以通过半消息来回查事务，如果半消息发送成功后一直没有被二次确认，那么就会回查事务状态。

什么情况会回查?

也会有两种情况

1）执行本地事务的时候，由于突然网络等原因一直没有返回执行事务的结果(commit或者rollback)导致最终返回UNKNOW，那么就会回查。

2) 本地事务执行成功后，返回Commit进行消息二次确认的时候的服务挂了，在重启服务那么这个时候在broker端
   它还是个Half Message(半消息)，这也会回查。

特别注意: 如果回查，那么一定要先查看当前事务的执行情况，再看是否需要重新执行本地事务。

想象下如果出现第二种情况而引起的回查，如果不先查看当前事务的执行情况，而是直接执行事务，那么就相当于成功执行了两个本地事务。

通过上面这幅图，我们可以看出，在上面举例事务不一致的两种情况中，永远不会发生

A账户减100 （失败），B账户加100 （成功）

因为：如果A服务本地事务都失败了，那B服务永远不会执行任何操作，因为消息压根就不会传到B服务。

那么 A账户减100 （成功），B账户加100 （失败） 会不会可能存在的。

答案是会的

因为A服务只负责当我消息执行成功了，保证消息能够送达到B,至于B服务接到消息后最终执行结果A并不管。

那B服务失败怎么办？

如果B最终执行失败，几乎可以断定就是代码有问题所以才引起的异常，因为消费端RocketMQ有重试机制，如果不是代码问题一般重试几次就能成功。

如果是代码的原因引起多次重试失败后，也没有关系，将该异常记录下来，由人工处理，人工兜底处理后，就可以让事务达到最终的一致性。

ningmengbaby

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
RocketMq实现分布式事务原理

如果B最终执行失败，几乎可以断定就是代码有问题所以才引起的异常，因为消费端RocketMQ有重试机制，如果不是代码问题一般重试几次就能成功。想象下如果出现第二种情况而引起的回查，如果不先查看当前事务的执行情况，而是直接执行事务，那么就相当于成功执行了两个本地事务。因为A服务只负责当我消息执行成功了，保证消息能够送达到B,至于B服务接到消息后最终执行结果A并不管。：如果A服务本地事务都失败了，那B服务永远不会执行任何操作，因为消息压根就不会传到B服务。3.就是A账户减100（成功），B账户加100 （失败）
复制链接

扫一扫