在分布式系统中,实际项目中,99%以上的场景为了提高系统的吞吐量和系统的性能,不会采用强一致性的策略,基本都是最终一致性的方案,采取中间件MQ,redis等来保证系统稳定和高的的吞吐量...本文就是讨论一下redis和mysql双写一致性问题的各种方案...对比各种方案的优缺点,大家可以根据自己的实际项目需求来选择自己项目实战的最优解...
前提:系统有一定的并发量...默认情况:大家都是以mysql数据为准,查询数据在mysql中存在....
1-【推荐】先更新数据库,然后删除缓存
更新用户信息 updateUserInfo | 查询用户信息getUserInfo |
updateUserInfo(User user){ userMapper.updateById(user);//mysql数据更新 redis.delete(userKey) } | getUserInfo(Long id){ User user=getFromRedis(); if(user==null){ user=getFromMysql(); setToRedis(user); } } |
时间 | 线程A-业务1 | 线程B-业务2 | 存在问题 |
t1 | 更新id=100的用户信息,update-mysql | ||
t2 | 查询id=100的用户信息 | 此时线程B查询id=100的用户信息,此时redis有数据,读取到脏数据了 | |
t3 | 删除redis缓存id=100的用户信息 | ||
t4 |
小结:线程会第一次查询到脏数据,后续数据是正常的,99%场景可以用
2-【不推荐】先删除缓存,然后更新数据库
更新用户信息 updateUserInfo | 查询用户信息getUserInfo |
updateUserInfo(User user){ redis.delete(userKey) userMapper.updateById(user);//mysql数据更新 } | getUserInfo(Long id){ User user=getFromRedis(); if(user==null){ user=getFromMysql(); setToRedis(user); } } |
时间 | 线程A-业务1 | 线程B-业务2 | 存在问题 |
t1 | 删除redis缓存id=100的用户信息 | ||
t2 | 查询id=100的用户信息 | 此时线程B查询id=100的用户信息,此时redis没有数据,去查询数据库,查询到了,然后set进去的数据还是脏数据,线程A更新了个寂寞.... | |
t3 | 更新id=100的用户信息,update-mysql | ||
t4 |
小结:由于线程A update的耗时一般比B的慢,这种场景出现的概率大,而且线程A更新了个寂寞...
3-【推荐】先删除缓存,然后更新数据库,再删除缓存
更新用户信息 updateUserInfo | 查询用户信息getUserInfo |
updateUserInfo(User user){ redis.delete(userKey) userMapper.updateById(user);//mysql数据更新 redis.delete(userKey) } | getUserInfo(Long id){ User user=getFromRedis(); if(user==null){ user=getFromMysql(); setToRedis(user); } } |
时间 | 线程A-业务1 | 线程B-业务2 | 存在问题 |
t1 | 删除redis缓存id=100的用户信息 | ||
t2 | 查询id=100的用户信息 | 此时线程B查询id=100的用户信息,此时redis没有数据,去查询数据库,查询到了,然后set进去的数据还是脏数据 | |
t3 | 更新id=100的用户信息,update-mysql | ||
t4 | 删除redis缓存id=100的用户信息 | ||
t5 | 再次查询会redis没有数据,会读取到最新数据 |
其实有了方案3本质上和方案1没有区别,优化点在方案3先删除了redis缓存,解决了方案1 线程A更新成功,还未set到redis中,但是线程B redis中拿不到数据,去mysql可以得到新的数据;相比较方案1降低了脏数据的可能性....
4-【推荐】先更新mysql-监听binlog-更新redis
此种方案应用在吞吐量特别高的系统,对数据一致性要求很高的场景,需要再引入第三方组件,比如阿里的canal监听binglog,然后缓存系统读取binglog去更新...增加系统复杂度....中小型系统不推荐使用...