缓存穿透
缓存穿透是指查询一个一定不存在的数据,由于缓存未命中,将去查询数据库,但是数据库也无此记录,这将导致这个不存在的数据每次请求都要到存储层去查询,失去了缓存的意义。
在流量大时,可能DB就挂掉了,要是有人利用不存在的key频繁攻击,这就是漏洞。
解决方案:
- 缓存空值,并设置较短的过期时间;
- 使用布隆过滤器判断缓存中是否存在;
BloomFilter:
BloomFilter 类似于一个大的set 用来判断某个元素(key)是否存在于某个集合中。
在缓存之前在加一层 BloomFilter ,在查询的时候先去 BloomFilter 去查询 key 是否存在,如果不存在就直接返回,存在再走查缓存 -> 查 DB。
如何选择:
针对于一些恶意攻击,攻击带过来的大量 key 是不存在的,那么我们采用缓存空值方案就会缓存大量不存在key的数据,此时这种方案就不合适了。
可以先使用BloomFilter进行过滤掉这些key。
针对这种key异常多、请求重复率比较低的数据,我们就没有必要进行缓存,使用第二种方案直接过滤掉。
而对于空数据的key有限的,重复率比较高的,我们则可以采用第一种方式进行缓存。
缓存雪崩
当某一时刻发生大规模的缓存失效的情况,比如你的缓存服务宕机了,会有大量的请求进来直接打到DB上面。结果就是DB撑不住,挂掉。
设置缓存失效时间时,增加一个随机值,就很难引发集体失效的事件了。
解决方案:
事前: 使用 Redis 哨兵主从或集群等架构提升高可用性;
事中: 限流并降级,在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存,其他线程等待;
事后: 开启Redis持久化机制,尽快恢复缓存服务,一旦重启,就能从磁盘上自动加载数据恢复内存中的数据。
缓存击穿
什么是击穿:
大量用户同时访问一个过期失效的缓存值,会同时访问到数据库,会瞬时造成数据库压力过大。
解决方案:
- 热点数据的缓存永不过期;
- 采用分布式锁,缓存失效后只有一个线程更新并写入;
分布式锁
在缓存更新或者过期的情况下,先获取锁,在进行更新或者从数据库中获取数据后,再释放锁,需要一定的时间等待,就可以从缓存中继续获取数据。