概述
缓存是实现高性能访问的利器,当缓存的数据有变化时应该先更新数据库再更新缓存?还是先更新缓存再更新数据库呢?又或者是其它什么方案?下面针对常用的缓存更新方案进行说明。
一、先更新缓存再更新数据库
-
为什么基本上没有人采用这种方案?个人见解如下:
更新缓存和更新数据库都有失败的可能,如果更新缓存成功而更新数据库失败,数据库里面存的还是老数据,如果缓存失效之后再从数据库读到的数据仍然是老数据,这会导致更新丢失,风险太大。 -
懒加载的思想。很多时候缓存不是简单从数据库取出来的值,很可能是多表联合查询计算得到的值,这时候更新缓存的代价较高,而更新之后又不一定会访问到这个缓存。删除缓存是一种懒加载的思想,只有用到的时候才去更新缓存。
二、 先更新数据库再更新缓存
- 不采用这种方案的原因同样是有懒加载的考虑在里面。
- 并发情况下缓存中的数据是旧数据
如下情况会有缓存和数据库数据不一致的问题,且缓存中是旧数据:
1、线程A更新了数据库
2、线程B更新了数据库
3、线程B更新了缓存
4、线程A更新了缓存
三、先删除缓存再更新数据库
考虑一个下面的场景:
1、线程A删除了缓存
2、线程B查询缓存发现缓存缺失
3、线程B去数据库查询得到旧值
4、线程B将旧值写入缓存
5、线程A将新值写入数据库
这种情况下会导致数据库中是新值、而缓存中是旧值,出现缓存不一致的情况。
解决方案
- 将删除缓存、更新数据库、读取缓存的操作串行化到队列中
- 延时双删策略,步骤5执行完成后休眠一段时间再进行删除缓存操作
四、先更新数据库再删除缓存(Cache-Aside pattern)
高并发场景下的一种情况:
1、缓存刚好失效
2、线程A查询数据库得到旧值
3、线程B将新值写入数据库
4、线程B将缓存删除
5、线程A将请求得到的旧值写入缓存
这种情况下会出现数据库中是新值、而缓存中是旧值的不一致情况。
发生这种条件的情况十分苛刻,因此出现几率极低,发生上面的情况需要:
- 步骤3的写操作比步骤2的读操作耗时更短才能让步骤4先于步骤5发生,写操作比读操作快的情况很难出现
解决方案
- 延时双删策略,上面的步骤不变,步骤5执行完成后休眠一段时间再把缓存删除
五、延时双删策略失效的解决方案——重试
参考链接: