面试官:Redis和Mysql如何保证数据一致性?

点击关注公众号:互联网架构师,后台回复 2T获取2TB学习资源!

上一篇:Alibaba开源内网高并发编程手册.pdf

前言

先阐明一下Mysql和Redis的关系:Mysql是数据库,用来持久化数据,一定程度上保证数据的可靠性;Redis是用来当缓存,用来提升数据访问的性能。

关于如何保证Mysql和Redis中的数据一致(即缓存一致性问题),这是一个非常经典的问题。

使用过缓存的人都应该知道,在实际应用场景中,要想实时刻保证缓存和数据库中的数据一样,很难做到。

基本上都是尽可能让他们的数据在绝大部分时间内保持一致,并保证最终是一致的。

1.缓存不一致是如何产生的

如果数据一直没有变更,那么就不会出现缓存不一致的问题。

通常缓存不一致是发生在数据有变更的时候。因为每次数据变更你需要同时操作数据库和缓存,而他们又属于不同的系统,无法做到同时操作成功或失败,总会有一个时间差。在并发读写的时候可能就会出现缓存不一致的问题(理论上通过分布式事务可以保证这一点,不过实际上基本上很少有人这么做)。

虽然没办法在数据有变更时,保证缓存和数据库强一致,但对缓存的更新还是有一定设计方法的,遵循这些设计方法,能够让这个不一致的影响时间和影响范围最小化。

2.缓存更新的几种设计

缓存更新的设计方法大概有以下四种:

  • 先删除缓存,再更新数据库(这种方法在并发下最容易出现长时间的脏数据,不可取)

  • 先更新数据库,删除缓存(Cache Aside Pattern)

  • 只更新缓存,由缓存自己同步更新数据库(Read/Write Through Pattern)

  • 只更新缓存,由缓存自己异步更新数据库(Write Behind Cache Pattern)

接下来详细介绍一些这四种设计方法

2.1 先删除缓存,再更新数据库

这种方法在并发读写的情况下容易出现缓存不一致的问题

635302e0474c00680c6ecec4a3469a5b.jpeg

如上图所示,其可能的执行流程顺序为:

  • 客户端1 触发更新数据A的逻辑

  • 客户端2 触发查询数据A的逻辑

  • 客户端1 删除缓存中数据A

  • 客户端2 查询缓存中数据A,未命中

  • 客户端2 从数据库查询数据A,并更新到缓存中

  • 客户端1 更新数据库中数据A

可见,最后缓存中的数据A跟数据库中的数据A是不一致的,缓存中的数据A是旧的脏数据。

因此一般不建议使用这种方式。

2.2 先更新数据库,再让缓存失效

这种方法在并发读写的情况下,也可能会出现短暂缓存不一致的问题

115d909f73c3772a52e40e0e94be2014.jpeg

如上图所示,其可能执行的流程顺序为:

  • 客户端1 触发更新数据A的逻辑

  • 客户端2 触发查询数据A的逻辑

  • 客户端3 触发查询数据A的逻辑

  • 客户端1 更新数据库中数据A

  • 客户端2 查询缓存中数据A,命中返回(旧数据)

  • 客户端1 让缓存中数据A失效

  • 客户端3 查询缓存中数据A,未命中

  • 客户端3 查询数据库中数据A,并更新到缓存中

可见,最后缓存中的数据A和数据库中的数据A是一致的,理论上可能会出现一小段时间数据不一致,不过这种概率也比较低,大部分的业务也不会有太大的问题。

2.3 只更新缓存,由缓存自己同步更新数据库(Read/Write Through Pattern)

这种方法相当于是业务只更新缓存,再由缓存去同步更新数据库。一个Write Through的 例子如下:

e95d66d9cc383e92fcabd5f010ed5234.jpeg

如上图所示,其可能执行的流程顺序为:

  • 客户端1 触发更新数据A的逻辑

  • 客户端2 触发查询数据A的逻辑

  • 客户端1 更新缓存中数据A,缓存同步更新数据库中数据A,再返回结果

  • 客户端2 查询缓存中数据A,命中返回

Read Through 和 WriteThrough 的流程类似,只是在客户端查询数据A时,如果缓存中数据A失效了(过期或被驱逐淘汰),则缓存会同步去数据库中查询数据A,并缓存起来,再返回给客户端

这种方式缓存不一致的概率极低,只不过需要对缓存进行专门的改造。

2.4 只更新缓存,由缓存自己异步更新数据库(Write Behind Cache Pattern)

这种方式性详单于是业务只操作更新缓存,再由缓存异步去更新数据库,例如:

f0758791e484376fada07ed01072c496.jpeg

如上图所示,其可能的执行流程顺序为:

  • 客户端1 触发更新数据A的逻辑

  • 客户端2 触发查询数据A的逻辑

  • 客户端1 更新缓存中的数据A,返回

  • 客户端2 查询缓存中的数据A,命中返回

  • 缓存异步更新数据A到数据库中

这种方式的优势是读写的性能都非常好,基本上只要操作完内存后就返回给客户端了,但是其是非强一致性,存在丢失数据的情况。

如果在缓存异步将数据更新到数据库中时,缓存服务挂了,此时未更新到数据库中的数据就丢失了。

总结

上面讲到的几种缓存更新的设计方式,都是前人总结出来的经验,这些方式或多或少都有一些弊端,并不完美,实际上也很难有完美的设计。大家在做系统设计的时候,也不要去追求完美,要有一些取舍,找到一种最适合自己业务场景的方式就行。

最后,关注公众号互联网架构师,在后台回复:2T,可以获取我整理的 Java 系列面试题和答案,非常齐全。

正文结束

推荐阅读 ↓↓↓

1.IDEA 28 个天花板技巧,YYDS!

2.Alibaba开源内网高并发编程手册.pdf

3.程序员一般可以从什么平台接私活?

4.40岁,刚被裁,想说点啥。

5.为什么国内 996 干不过国外的 955呢?

6.中国的铁路订票系统在世界上属于什么水平?                        

7.15张图看懂瞎忙和高效的区别!

52b3aa586e0da1634da41e39917999a0.gif

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值