1.背景:
在业务流程操作数据库的过程中,随着数据量的增加,通常会进行分库分表、或者冷热分离等操作。但MySQL的事务只在一个数据源生效,意味着如果在同一个事务中同时操作两个或者多个数据源的数据,在发生RuntimeException的时候只有一个数据源的数据会进行回滚,其余的均不会发生回滚,导致脏数据的产生。
2.解决方式:
(1)专门的分布式事务中间件比如:Seata(缺点是需要引入中间件,增加维护成本)
(2)基于补偿的方式,发生异常的情况下丢进消息队列,或者中间的数据表,后续基于消息队列或者中间数据表进行重试或者补偿。(缺点是可能导致下游业务消费到中间状态的脏数据,其次增加维护成本)
(3)业务逻辑增加异常处理逻辑,A、B两个数据源的操作,一个次要的操作先处理,另一个主要的操作后处理。发生异常的情况下分别进行数据删除或或者失效处理。无需引入其他的中间件(缺点是可能导致下游业务消费到中间状态的脏数据,其次增加维护成本,增加业务的开发成本)
3.备注
(1)为了减少这种跨数据源异常,事务最小化原则,不要在事务中进行其他操作。比如:调用其他服务,记录中间日志表等。
(2)排查类似数据,需要上下游业务完业务异常监控告警。