缓存击穿问题

       缓存穿透是指查询一个一定不存在的数据,由于缓存不命中,并且出于容错考虑, 如果从存储层查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到存储层去查询,失去了缓存的意义。
       例如:下图是一个比较典型的cache-storage架构,cache(例如memcache, redis等等) + storage(例如mysql, hbase等等)架构,查一个压根就不存在的值, 如果不做兼容,永远会查询storage。

二. 危害:
       对底层数据源(mysql, hbase, http接口, rpc调用等等)压力过大,有些底层数据源不具备高并发性。例如mysql一般来说单台能够扛1000-QPS就已经很不错了(别说你的查询都是select * from table where id=xx 以及你的机器多么牛逼,那就有点矫情了)这时,会拖死整个系统。
     例如他人提供的一个抗压性很差的http接口,可能穿透会击溃他的服务。

三. 如何发现
       我们可以分别记录cache命中数, storage命中数,以及总调用量,如果发现空命中(cache,storage都没有命中)较多,可能就会在缓存穿透问题。

注意:缓存本身的命中率(例如redis中的info提供了类似数字,只代表缓存本身)不代表storage和业务的命中率。

四. 产生原因以及业务是否允许

产生原因有很多:可能是代码本身或者数据存在的问题造成的,也很有可能是一些恶意攻击、爬虫等等(因为http读接口都是开放的)

业务是否允许:这个要看做的项目或者业务是否允许这种情况发生,比如做一些非实时的推荐系统,假如新用户来了,确实没有他的推荐数据(推荐数据通常是根据历史行为算出),这种业务是会发生穿透现象的,至于业务允不允许要具体问题具体分析了。

五. 解决方法

1、缓存控对象:

1)定义:如上图所示,当第②步MISS后,仍然将空对象保留到Cache中(可能是保留几分钟或者一段时间,具体问题具体分析),下次新的Request(同一个key)将会从Cache中获取到数据,保护了后端的Storage。
2)适用场景:数据命中不高,数据频繁变化实时性高(一些乱转业务)
3)维护成本:代码比较简单,但是有两个问题:

  • 第一是空值做了缓存,意味着缓存系统中存了更多的key-value,也就是需要更多空间(有人说空值没多少,但是架不住多啊),解决方法是我们可以设置一个较短的过期时间。
  • 第二是数据会有一段时间窗口的不一致,假如,Cache设置了5分钟过期,此时Storage确实有了这个数据的值,那此段时间就会出现数据不一致,解决方法是我们可以利用消息或者其他方式,清除掉Cache中的数据。

伪代码

package com.carlosfu.service;  
  
import org.apache.commons.lang.StringUtils;  
  
import com.carlosfu.cache.Cache;  
import com.carlosfu.storage.Storage;  
  
/** 
 * 某服务 
 *  
 * @author carlosfu 
 * @Date 2015-10-11 
 * @Time 下午6:28:46 
 */  
public class XXXService {  
  
    /** 
     * 缓存 
     */  
    private Cache cache = new Cache();  
  
    /** 
     * 存储 
     */  
    private Storage storage = new Storage();  
  
    /** 
     * 模拟正常模式 
     * @param key 
     * @return 
     */  
    public String getNormal(String key) {  
        // 从缓存中获取数据  
        String cacheValue = cache.get(key);  
        // 缓存为空  
        if (StringUtils.isBlank(cacheValue)) {  
            // 从存储中获取  
            String storageValue = storage.get(key);  
            // 如果存储数据不为空,将存储的值设置到缓存  
            if (StringUtils.isNotBlank(storageValue)) {  
                cache.set(key, storageValue);  
            }  
            return storageValue;  
        } else {  
            // 缓存非空  
            return cacheValue;  
        }  
    }  
  
  
    /** 
     * 模拟防穿透模式 
     * @param key 
     * @return 
     */  
    public String getPassThrough(String key) {  
        // 从缓存中获取数据  
        String cacheValue = cache.get(key);  
        // 缓存为空  
        if (StringUtils.isBlank(cacheValue)) {  
            // 从存储中获取  
            String storageValue = storage.get(key);  
            cache.set(key, storageValue);  
            // 如果存储数据为空,需要设置一个过期时间(300秒)  
            if (StringUtils.isBlank(storageValue)) {  
                cache.expire(key, 60 * 5);  
            }  
            return storageValue;  
        } else {  
            // 缓存非空  
            return cacheValue;  
        }  
    }  
  
}  

2、布隆过滤:

1)定义:如上图所示,在访问所有资源(cache, storage)之前,将存在的key用布隆过滤器提前保存起来,做第一层拦截。例如: 我们的推荐服务有4亿个用户uid, 我们会根据用户的历史行为进行推荐(非实时),所有的用户推荐数据放到hbase中,但是每天有许多新用户来到网站,这些用户在当天的访问就会穿透到hbase。为此我们每天4点对所有uid做一份布隆过滤器。如果布隆过滤器认为uid不存在,那么就不会访问hbase,在一定程度保护了hbase(减少30%左右)。
2)适用场景:数据命中不高,数据相对固定实时性低(通常是数据集较大)
3)维护成本:代码维护复杂, 缓存空间占用少

3、使用锁:

即根据key获取value值为空时,锁上,从数据库中load数据后再释放锁。若其它线程获取锁失败,则等待一段时间后重试。这里要注意,分布式环境中要使用分布式锁,单机的话用普通的锁(synchronized、Lock)就够了。

这样做思路比较清晰,也从一定程度上减轻数据库压力,但是锁机制使得逻辑的复杂度增加,吞吐量也降低了,有点治标不治本。

参考:

https://blog.csdn.net/fanrenxiang/article/details/80542580

补充:缓存雪崩问题

缓存雪崩:是指缓存在同一时间内大量键过期(失效),接着来的一大波请求瞬间都落在了数据库中导致连接异常.
解决方案:
方案1、也是像解决缓存穿透一样加锁排队,实现同上;
方案2、建立备份缓存,缓存A和缓存B,A设置超时时间,B不设值超时时间,先从A读缓存,A没有读B,并且更新A缓存和B缓存;
方案3、设置缓存超时时间的时候加上一个随机的时间长度,比如这个缓存key的超时时间是固定的5分钟加上随机的2分钟,酱紫可从一定程度上避免雪崩问题;

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值