使用Redis缓存踩过的坑

最新推荐文章于 2024-09-30 15:36:16 发布

一枚码仔

最新推荐文章于 2024-09-30 15:36:16 发布

阅读量660

点赞数 8

分类专栏： Redis 文章标签：缓存 redis spring

本文链接：https://blog.csdn.net/qq_47183158/article/details/140794541

版权

Redis 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

前言

缓存在日常工作中经常会使用，但如果用不好坑也挺多的，文章总结了使用缓存遇到的坑。

1 缓存穿透

大部分情况下，加缓存的目的是：为了减轻数据库的压力，提升系统的性能。

一般情况下请求过来，先查缓存，如果缓存中存在数据，则直接返回。如果缓存中不存在，则再查数据库，如果数据库中存在，则将数据放入缓存，然后返回。如果数据库中也不存在，则直接返回失败。

流程图如下：

但如果出现以下这两种特殊情况，比如：

用户请求的id在缓存中不存在。
恶意用户伪造不存在的id发起请求。

这样的用户请求导致的结果是：每次从缓存中都查不到数据，而需要查询数据库，同时数据库中也没有查到该数据，也没法放入缓存。

也就是说，每次这个用户请求过来的时候，都要查询一次数据库。

图中标红的箭头表示每次走的路线。

很显然，缓存根本没起作用，好像被穿透了一样，每次都会去访问数据库。

这就是我们所说的缓存穿透问题。

如果此时穿透了缓存，而直接数据库的请求数量非常多，数据库可能因为扛不住压力而挂掉。

那么如何解决这个问题呢？

1.1 校验参数

可以对用户id做检验。比如你的合法id是15xxxxxx，以15开头的。如果用户传入了16开头的id，比如：16232323，则参数校验失败，直接把相关请求拦截掉。这样可以过滤掉一部分恶意伪造的用户id。

1.2 使用布隆过滤器

如果数据比较少，可以把数据库中的数据，全部放到内存的一个map中。

这样能够非常快速的识别，数据在缓存中是否存在。如果存在，则让其访问缓存。如果不存在，则直接拒绝该请求。

但如果数据量太多了，有数千万或者上亿的数据，全都放到内存中，很显然会占用太多的内存空间。这就需要使用布隆过滤器了。

布隆过滤器底层使用bit数组存储数据，该数组中的元素默认值是0。

布隆过滤器第一次初始化的时候，会把数据库中所有已存在的key，经过一些列的hash算法（比如：三次hash算法）计算，每个key都会计算出多个位置，然后把这些位置上的元素值设置成1。

之后，有用户key请求过来的时候，再用相同的hash算法计算位置。

如果多个位置中的元素值都是1，则说明该key在数据库中已存在。这时允许继续往后面操作。
如果有1个以上的位置上的元素值是0，则说明该key在数据库中不存在。这时可以拒绝该请求，而直接返回。

1.3 缓存空值

上面使用布隆过滤器，虽说可以过滤掉很多不存在的用户id请求。但它除了增加系统的复杂度之外，会带来两个问题：

布隆过滤器存在误杀的情况，可能会把少部分正常用户的请求也过滤了。
如果用户信息有变化，需要实时同步到布隆过滤器，不然会有问题。

所以，通常情况下很少用布隆过滤器解决缓存穿透问题。其实，还有另外一种更简单的方案，即：缓存空值。

当某个用户id在缓存中查不到，在数据库中也查不到时，也需要将该用户id缓存起来，只不过值是空的。这样后面的请求，再拿相同的用户id发起请求时，就能从缓存中获取空数据，直接返回了，而无需再去查一次数据库。

流程图如下：关键点是不管从数据库有没有查到数据，都将结果放入缓存中，只是如果没有查到数据，缓存中的值是空的罢了。

2 缓存击穿

有时候，我们在访问热点数据时。比如：我们在某个商城购买某个热门商品。

为了保证访问速度，通常情况下，商城系统会把商品信息放到缓存中。但如果某个时刻，该商品到了过期时间失效了。此时，如果有大量的用户请求同一个商品，但该商品在缓存中失效了，一下子这些用户请求都直接怼到数据库，可能会造成瞬间数据库压力过大，而直接挂掉。

流程图如下：

如何解决这个问题呢？

2.1 加锁

数据库压力过大的根源是，因为同一时刻太多的请求访问了数据库。如果我们能够限制，同一时刻只有一个请求才能访问某个productId的数据库商品信息，不就能解决问题了？所以可以用加锁的方式，实现上面的功能。

伪代码如下：

try {  
  String result = jedis.set(productId, requestId, "NX", "PX", expireTime);  
  if ("OK".equals(result)) {  
    return queryProductFromDbById(productId);  
  }  
} finally{  
    unlock(productId,requestId);  
}    
return null;

在访问数据库时加锁，防止多个相同productId的请求同时访问数据库。然后还需要一段代码，把从数据库中查询到的结果，又重新放入缓存中。

2.2 自动续期

出现缓存击穿问题是由于key过期了导致的。那么，我们换一种思路，在key快要过期之前，就自动给它续期，不就OK了？

答：没错，我们可以用job给指定key自动续期。

比如说，我们有个分类功能，设置的缓存过期时间是30分钟。但有个job每隔20分钟执行一次，自动更新缓存，重新设置过期时间为30分钟。这样就能保证，分类缓存不会失效。

2.3 永久有效

此外，对于很多热门key，其实是可以不用设置过期时间，让其永久有效的。

比如参与秒杀活动的热门商品，由于这类商品id并不多，在缓存中我们可以不设置过期时间。

在秒杀活动开始前，我们先用一个程序提前从数据库中查询出商品的数据，然后同步到缓存中，提前做预热。

等秒杀活动结束一段时间之后，我们再手动删除这些无用的缓存即可。

3 缓存雪崩

而缓存雪崩是缓存击穿的升级版，缓存击穿说的是某一个热门key失效了，而缓存雪崩说的是有多个热门key同时失效。缓存雪崩目前有两种：

有大量的热门缓存，同时失效。会导致大量的请求，访问数据库。而数据库很有可能因为扛不住压力，而直接挂掉。
缓存服务器down机了，可能是机器硬件问题，或者机房网络问题。总之，造成了整个缓存的不可用。

归根结底都是有大量的请求，透过缓存，而直接访问数据库了。

如何解决这个问题呢？

3.1 过期时间加随机数

为了解决缓存雪崩问题，首先要尽量避免缓存同时失效的情况发生。这就要求我们不要设置相同的过期时间。

可以在设置的过期时间基础上，再加个1~60秒的随机数。

实际过期时间 = 过期时间 + 1~60秒的随机数

这样即使在高并发的情况下，多个请求同时设置过期时间，由于有随机数的存在，也不会出现太多相同的过期key。

3.2 保证高可用

针对缓存服务器宕机的情况，在前期做系统设计时，可以做一些高可用架构。比如使用redis哨兵模式，或者集群模式，避免出现单节点故障导致整个redis服务不可用的情况。

使用哨兵模式之后，当某个master服务下线时，自动将该master下的某个slave服务升级为master服务，替代已下线的master服务继续处理请求。

3.3 服务降级

如果做了高可用架构，redis服务还是挂了，该怎么办呢？这时候就需要做服务降级了。

需要配置一些默认的兜底数据。

程序中有个全局开关，比如有10个请求在最近一分钟内，从redis中获取数据失败，则全局开关打开。后面的新请求，就直接从配置中心中获取默认的数据。

当然，还需要有个job，每隔一定时间去从redis中获取数据，如果在最近一分钟内可以获取到两次数据（这个参数可以自己定），则把全局开关关闭。后面来的请求，又可以正常从redis中获取数据了。

需要特别说一句，该方案并非所有的场景都适用，需要根据实际业务场景决定。

4 数据不一致

数据库和缓存（比如：redis）双写数据一致性问题，是一个跟开发语言无关的公共问题。尤其在高并发的场景下，这个问题变得更加严重。那么该如何更新缓存呢？

目前有以下4种方案：

先写缓存，再写数据库
先写数据库，再写缓存
先删缓存，再写数据库
先写数据库，再删缓存

4.1 先写缓存，再写数据库

对于更新缓存的方案，很多人第一个想到的可能是在写操作中直接更新缓存（写缓存），更直接明了。

那么，问题来了：在写操作中，到底是先写缓存，还是先写数据库呢？

我们在这里先聊聊先写缓存，再写数据库的情况，因为它的问题最严重。

某一个用户的每一次写操作，如果刚写完缓存，突然网络出现了异常，导致写数据库失败了。

其结果是缓存更新成了最新数据，但数据库没有，这样缓存中的数据不就变成脏数据了？如果此时该用户的查询请求，正好读取到该数据，就会出现问题，因为该数据在数据库中根本不存在，这个问题非常严重。

我们都知道，缓存的主要目的是把数据库的数据临时保存在内存，便于后续的查询，提升查询速度。

但如果某条数据，在数据库中都不存在，你缓存这种“假数据”又有啥意义呢？

因此，先写缓存，再写数据库的方案是不可取的，在实际工作中用得不多。

4.2 先写数据库，再写缓存

既然上面的方案行不通，接下来，聊聊先写数据库，再写缓存的方案，该方案在低并发编程中有人在用。

用户的写操作，先写数据库，再写缓存，可以避免之前“假数据”的问题。但它却带来了新的问题。

4.2.1 写缓存失败了

如果把写数据库和写缓存操作，放在同一个事务当中，当写缓存失败了，我们可以把写入数据库的数据进行回滚。

如果是并发量比较小，对接口性能要求不太高的系统，可以这么玩。

但如果在高并发的业务场景中，写数据库和写缓存，都属于远程操作。为了防止出现大事务，造成的死锁问题，通常建议写数据库和写缓存不要放在同一个事务中。

也就是说在该方案中，如果写数据库成功了，但写缓存失败了，数据库中已写入的数据不会回滚。

这就会出现：数据库是新数据，而缓存是旧数据，两边数据不一致的情况。

4.2.2 高并发下的问题

假设在高并发的场景中，针对同一个用户的同一条数据，有两个写数据请求：a和b，它们同时请求到业务系统。

在这个过程当中，可能会出现请求b在缓存中的新数据，被请求a的旧数据覆盖了。

也就是说：在高并发场景中，如果多个线程同时执行先写数据库，再写缓存的操作，可能会出现数据库是新值，而缓存中是旧值，两边数据不一致的情况。

4.2.3 浪费系统资源

该方案还有一个比较大的问题就是：每个写操作，写完数据库，会马上写缓存，比较浪费系统资源。

为什么这么说呢？

可以试想一下，如果写的缓存，并不是简单的数据内容，而是要经过非常复杂的计算得出的最终结果。这样每写一次缓存，都需要经过一次非常复杂的计算，不是非常浪费系统资源吗？

尤其是cpu和内存资源。

还有些业务场景比较特殊：写多读少。

如果在这类业务场景中，每个用的写操作，都需要写一次缓存，有点得不偿失。

由此可见，在高并发的场景中，先写数据库，再写缓存，这套方案问题挺多的，也不太建议使用。

4.3 先删缓存，再写数据库

说白了，在用户的写操作中，先执行删除缓存操作，再去写数据库。这套方案，可以是可以，但也会有一样问题。

4.3.1 高并发下的问题

假设在高并发的场景中，同一个用户的同一条数据，有一个读数据请求c，还有另一个写数据请求d（一个更新操作），同时请求到业务系统。

在这个过程当中，有可能会出现请求d的新值，并没有被请求c写入缓存，同样会导致缓存和数据库的数据不一致的情况。

4.4 先写数据库，再删缓存

在高并发的场景中，有一个读数据请求f，有一个写数据请求e。

在高并发的场景中，有一个读数据请求，有一个写数据请求，更新过程如下：

请求e先写数据库，由于网络原因卡顿了一下，没有来得及删除缓存。请求f查询缓存，发现缓存中有数据，直接返回该数据。请求e删除缓存。在这个过程中，只有请求f读了一次旧数据，后来旧数据被请求e及时删除了，看起来问题不大。

但如果是读数据请求先过来呢？

请求f查询缓存，发现缓存中有数据，直接返回该数据
请求e先写数据库
请求e删除缓存

这种情况看起来也没问题呀？

答：对的。

但就怕出现下面这种情况，即缓存自己失效了。如下图所示：

缓存过期时间到了，自动失效。
请求f查询缓存，发缓存中没有数据，查询数据库的旧值，但由于网络原因卡顿了，没有来得及更新缓存。
请求e先写数据库，接着删除了缓存。
请求f更新旧值到缓存中。

这时，缓存和数据库的数据同样出现不一致的情况了。但这种情况还是比较少的，需要同时满足以下条件才可以：

缓存刚好自动失效。
请求f从数据库查出旧值，更新缓存的耗时，比请求e写数据库，并且删除缓存的还长。

我们都知道查询数据库的速度，一般比写数据库要快，更何况写完数据库，还要删除缓存。所以绝大多数情况下，写数据请求比读数据情况耗时更长。

由此可见，系统同时满足上述两个条件的概率非常小。

想更详细的了解数据和缓存双写一致性问题，可以看《如何保证数据库和缓存双写一致性？》，里面有非常详细的介绍。

5 大key问题

在使用Redis缓存的时候，还有一个经常会遇到的问题是大key问题。

可能系统刚上线时，数据量少，在Redis中定义的key比较小，开发人员在做系统设计时，也没考虑这个问题。

系统运行了很长一段时间也没有问题。

但随着时间的推移，用户的数据越来越多，慢慢形成了大key问题。

可能在突然的某一天之后发现，线上某个接口耗时越来越长了。

追查原因，发现是大key问题导致的。

大key问题是指：缓存中单个key的value值过大。

之前我开发过一个分类树查询接口，为了性能考虑，使用job提前将分类树，保存到缓存中。

刚开始分类不多，只有几百个，分类树查询接口的响应挺快的。

但用了几年之后，分类数据涨到了上万个，该接口出现了性能问题，一查发现是大key引起的。

我们需要做优化，那么如何优化呢？

5.1 缩减字段名

为了优化在Redis中存储数据的大小，我们首先需要对数据进行瘦身。只保存需要用到的字段。

例如：

@AllArgsConstructor  
@Data  
public class Category {  
    private Long id;  
    private String name;  
    private Long parentId;  
    private Date inDate;  
    private Long inUserId;  
    private String inUserName;  
    private List children;  
}

像这个分类对象中inDate、inUserId和inUserName字段是可以不用保存的。修改自动名称。

例如：

@AllArgsConstructor  
@Data  
public class Category {  
    /**  
     * 分类编号  
     */  
    @JsonProperty("i")  
    private Long id;  

    /**  
     * 分类层级  
     */  
    @JsonProperty("l")  
    private Integer level;  

    /**  
     * 分类名称  
     */  
    @JsonProperty("n")  
    private String name;  

    /**  
     * 父分类编号  
     */  
    @JsonProperty("p")  
    private Long parentId;  

    /**  
     * 子分类列表  
     */  
    @JsonProperty("c")  
    private List children;  
}