数据访问流程:
数据访问的逻辑是先看缓存有没有数据,没有的话就从数据库读取,并且将数据更新到缓存。如果有,就直接从缓存返回值。
缓存穿透
缓存穿透:在高并发下,查询一个不存在的值(数据库和缓存里都没有的值)时,缓存不会被命中,导致大量请求直接落到数据库上。访问数据会先访问缓存,如果数据不存在缓存中才会查询数据库,但是查询数据库也查询不出来数据,也就是说当前访问数据永远不会写入缓存中。缓存层形同虚设,每次请求都会到db层,造成数据库负担过大。
如何避免:
- 接口层增加校验,如用户鉴权校验,id做基础校验,id<=0的直接拦截;
- 从缓存取不到的数据,在数据库中也没有取到,这时保存空对象到缓存层(将key-value对写为key-null),设置较短的失效时间,设置太长会导致正常情况也没法使用。
- 采用bloom filter保存缓存过的key,在访问请求到来时可以过滤掉不存在的key,防止这些请求到db层;
- 设置布隆过滤器;
缓存击穿
缓存击穿:在高并发下,对一个特定的值(缓存中没有但数据库中有的数据)进行查询,但是这个时候缓存正好过期了,缓存没有命中;如果并发很大,在这段时间内,这些请求都发现缓存没数据,都去数据库取数据,给数据库造成很大的压力,之后更新到缓存,又会导致重复缓存一个数据。
如何避免:
- 设置热点数据永远不过期。
- 当一个请求发现缓存没有以后,把缓存置为一个特殊值,然后去更新缓存,其他请求看到是特殊值就知道该等待,避免大量请求进入数据库,造成压力。
缓存雪崩
缓存雪崩:在高并发下,大量的缓存key在同一时间失效,导致大量的请求落到数据库上,如活动系统里面同时进行着非常多的活动,但是在某个时间点所有的活动缓存全部过期。
如何避免:
- 将缓存数据的过期时间设置随机,防止同一时间大量数据过期现象发生。
- 如果缓存数据库是分布式部署,将热点数据均匀分布在不同的缓存数据库中。
- 设置热点数据永远不过期。