《二》redis数据一致性总结

最新推荐文章于 2024-09-11 09:12:47 发布

付三三_

最新推荐文章于 2024-09-11 09:12:47 发布

阅读量1.8k

点赞数 2

分类专栏：技术--开发类文章标签： redis数据

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/qq_30546099/article/details/88602808

版权

技术--开发类专栏收录该内容

40 篇文章 1 订阅

订阅专栏

【1】如何保证缓存与数据库的双写一致性？

Cache Aside Pattern

1.读的时候，先读缓存，缓存没有的话，那么就读数据库，然后取出数据后放入缓存，同时返回响应

2.更新的时候，先删除缓存，然后再更新数据库

【2】为什么是删除缓存，而不是更新缓存？

因为有可能查出来的数据不是通过指定字段进行查询出来的简单的数据，而是有多个表进行多个计算出来的复杂数据。

【3】数据库与缓存双写不一致问题？

3.1 最初级的缓存不一致问题以及解决方案？

问题：先修改数据库，在删除缓存，如果删除缓存失败了，那么会导致数据库中数据是新数据，缓存中是修改前的旧数据，数据出现不一致。

解决思路：先删除缓存在删除数据库，如果修改数据库失败了，那么数据库中是旧数据，缓存中是空的，那么数据不会导致不一致，因为读的时候缓存没有。则读数据库中是旧数据，然后更新到缓存中。

3.2比较复杂的数据不一致问题分析

数据发生了变更，先删除了缓存，然后要去修改数据库，此时还没有修改，一个请求过来，去读缓存，发现缓存空了，去读数据库，查到了修改前的旧数据，放到了缓存中，数据变更的程序中完成了数据库的修改。

此时数据库和缓存中数据就不一致了。。

总结:读请求和写请求串行化，串到一个内存队列中。

【4】为什么上亿流程高并发场景下，缓存会出现这个问题呢？

只有在对一个数据在高并发的情况下进行读写的时候，才可能出现这种问题。

其实如果说你的并发量很低的话，特别是读并发很低，每天访问量就1万次，那么很少的情况下，会出现刚才描述的那种不一致的场景。但是问题是，如果每天的是上亿的流量，每秒并发读是几万，每秒只要有数据更新的请求，就可能会出现上述的数据库+缓存不一致的情况

【5】数据库与缓存更新与读取操作进行异步串行化？

更新数据库的时候，根据数据库的唯一标识，将数据路由之后，发送到一个jvm内部的队列中，读取数据的时候，如果发现数据不在缓存中，那么将重新读取数据+更新缓存的操作，根据唯一标识路由之后，也发送同一个jvm内部的队列中，一个队列对应一个工作线程。

每个工作线程串行拿到对应的操作，然后一条一条的执行，这样的话，一个数据变更的操作，先执行删除缓存，然后再去更新数据库，但是还没完成更新，此时一个读请求过来，读到了空的缓存，那么可以先将缓存更新的请求发送到队列中，此时会在队列中有积压，然后同步等待缓存更新完成。

这里有一个优化点，一个队列中，其实多个更新缓存请求串在一起是咩意义的，因此可以做过滤，如果发现队列中已经有一个更新缓存的请求了，那么久不用在放个更新请求操作进去了，直接等待前面的更新操作请求完成即可。待那个队列对应的工作线程完成了上一个操作的数据库的修改之后，才会去执行下一个操作，也就是缓存更新的操作，此时会从数据库中读取最新的值，然后写入缓存中。

如果请求还在等待时间范围内，不断轮询发现可以取到值了，那么久直接返回；如果请求等待的时间超过一定的时常，那么这一次直接从数据库中读取当前的旧值。

【6】高并发的场景下，该解决方案要注意的问题

（1）读请求长时阻塞

由于读请求进行了非常轻度的异步化，所以一定要注意读超时的问题，每个读请求必须在超时时间范围内返回

该解决方案，最大的风险点在于说，可能数据更新很频繁，导致队列中积压了大量更新操作在里面，然后读请求会发生大量的超时，最后导致大量的请求直接走数据库

务必通过一些模拟真实的测试，看看更新数据的频繁是怎样的

另外一点，因为一个队列中，可能会积压针对多个数据项的更新操作，因此需要根据自己的业务情况进行测试，可能需要部署多个服务，每个服务分摊一些数据的更新操作

如果一个内存队列里居然会挤压100个商品的库存修改操作，每隔库存修改操作要耗费10ms区完成，那么最后一个商品的读请求，可能等待10 * 100 = 1000ms = 1s后，才能得到数据

这个时候就导致读请求的长时阻塞

一定要做根据实际业务系统的运行情况，去进行一些压力测试，和模拟线上环境，去看看最繁忙的时候，内存队列可能会挤压多少更新操作，可能会导致最后一个更新操作对应的读请求，会hang多少时间，如果读请求在200ms返回，如果你计算过后，哪怕是最繁忙的时候，积压10个更新操作，最多等待200ms，那还可以的

如果一个内存队列可能积压的更新操作特别多，那么你就要加机器，让每个机器上部署的服务实例处理更少的数据，那么每个内存队列中积压的更新操作就会越少

其实根据之前的项目经验，一般来说数据的写频率是很低的，因此实际上正常来说，在队列中积压的更新操作应该是很少的