引言
缓存与数据库的一致性即更新数据库中的记录后,缓存的数据也可要同步更新,不然会读到脏数据。事实上我们是无法保证缓存与数据库中的强一致性的,一定会有延迟,我们只能保证其最终一致性。
首先要明确的是,我们不更新缓存的数据,而是删除缓存,然后由下个请求去去缓存,发现不存在后再读取数据库,写入缓存。因为操作简单,带来的副作用也只是一次cache miss而已,删除缓存可能会因为线程安全的原因导致脏数据,比如线程a,b先后更新数据库,但是由于网络阻塞等原因,更新缓存的顺序是b,a,从而导致脏数据。
明确了删除缓存而非更新缓存的原则后,实现一致性无外乎就两种思路:
- 先删除缓存,再更新数据库
- 先更新数据库,再删除缓存
下面我们深入剖析这两种思路,看看谁优谁劣?
先缓存后数据库
考虑这种情况:
(1)请求 A 进行写操作,删除缓存
(2)请求 B 查询发现缓存不存在
(3)请求 B 去数据库查询得到旧值
(4)请求 B 将旧值写入缓存
(5)请求 A 将新值写入数据库
上述情况下,即使A删除了缓存,缓存中依然存在脏数据,如果没有设置过期时间,这个脏数据永远不会被清除。
这么看来这种思路并非最优解,但是上有政策下有对策,聪明的程序员们想到了使用“延迟双删”来解决这个问题。还是这个问题,使用延