发现并处理Redis的大Key和热Key

救救孩子把

于 2024-08-14 09:44:15 发布

阅读量679

点赞数 17

分类专栏： Redis 文章标签： redis 数据库

本文链接：https://blog.csdn.net/yuanmomoya/article/details/141163560

版权

Redis 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

大Key和热Key的定义

名词	解释
大Key	通常以Key的大小和Key中成员的数量来综合判定，例如： Key本身的数据量过大：一个String类型的Key，它的值为5 MB。 Key中的成员数过多：一个ZSET类型的Key，它的成员数量为10,000个。 Key中成员的数据量过大：一个Hash类型的Key，它的成员数量虽然只有2,000个但这些成员的Value（值）总大小为100 MB。
热Key	通常以其接收到的Key被请求频率来判定，例如： QPS集中在特定的Key：Redis实例的总QPS（每秒查询率）为10,000，而其中一个Key的每秒访问量达到了7,000。带宽使用率集中在特定的Key：对一个拥有上千个成员且总大小为1 MB的HASH Key每秒发送大量的HGETALL操作请求。 CPU使用时间占比集中在特定的Key：对一个拥有数万个成员的Key（ZSET类型）每秒发送大量的ZRANGE操作请求。

名词

解释

大Key

通常以Key的大小和Key中成员的数量来综合判定，例如：
Key本身的数据量过大：一个String类型的Key，它的值为5 MB。
Key中的成员数过多：一个ZSET类型的Key，它的成员数量为10,000个。
Key中成员的数据量过大：一个Hash类型的Key，它的成员数量虽然只有2,000个但这些成员的Value（值）总大小为100 MB。

热Key

通常以其接收到的Key被请求频率来判定，例如：
QPS集中在特定的Key：Redis实例的总QPS（每秒查询率）为10,000，而其中一个Key的每秒访问量达到了7,000。
带宽使用率集中在特定的Key：对一个拥有上千个成员且总大小为1 MB的HASH Key每秒发送大量的HGETALL操作请求。
CPU使用时间占比集中在特定的Key：对一个拥有数万个成员的Key（ZSET类型）每秒发送大量的ZRANGE操作请求。

大白话大Key和热Key

大Key：占用内存比较大的key

热Key：其实热key问题说来也很简单，就是瞬间有几十万的请求去访问redis上某个固定的key，从而压垮缓存服务的情情况。
也是有不少这样的例子。微博举例子，比如XX明星结婚。那么关于XX明星的Key就会瞬间增大，就会出现热数据问题。

大Key和热Key引发的问题

类别	说明
大Key	客户端执行命令的时长变慢。 Redis内存达到maxmemory参数定义的上限引发操作阻塞或重要的Key被逐出，甚至引发内存溢出（Out Of Memory）。集群架构下，某个数据分片的内存使用率远超其他数据分片，无法使数据分片的内存资源达到均衡。对大Key执行读请求，会使Redis实例的带宽使用率被占满，导致自身服务变慢，同时易波及相关的服务。对大Key执行删除操作，易造成主库较长时间的阻塞，进而可能引发同步中断或主从切换。
热Key	占用大量的CPU资源，影响其他请求并导致整体性能降低。集群架构下，产生访问倾斜，即某个数据分片被大量访问，而其他数据分片处于空闲状态，可能引起该数据分片的连接数被耗尽，新的连接建立请求被拒绝等问题。在抢购或秒杀场景下，可能因商品对应库存Key的请求量过大，超出Redis处理能力造成超卖。热Key的请求压力数量超出Redis的承受能力易造成缓存击穿，即大量请求将被直接指向后端的存储层，导致存储访问量激增甚至宕机，从而影响其他业务。

类别

说明

大Key

客户端执行命令的时长变慢。
Redis内存达到maxmemory参数定义的上限引发操作阻塞或重要的Key被逐出，甚至引发内存溢出（Out Of Memory）。
集群架构下，某个数据分片的内存使用率远超其他数据分片，无法使数据分片的内存资源达到均衡。
对大Key执行读请求，会使Redis实例的带宽使用率被占满，导致自身服务变慢，同时易波及相关的服务。
对大Key执行删除操作，易造成主库较长时间的阻塞，进而可能引发同步中断或主从切换。

热Key

占用大量的CPU资源，影响其他请求并导致整体性能降低。
集群架构下，产生访问倾斜，即某个数据分片被大量访问，而其他数据分片处于空闲状态，可能引起该数据分片的连接数被耗尽，新的连接建立请求被拒绝等问题。
在抢购或秒杀场景下，可能因商品对应库存Key的请求量过大，超出Redis处理能力造成超卖。
热Key的请求压力数量超出Redis的承受能力易造成缓存击穿，即大量请求将被直接指向后端的存储层，导致存储访问量激增甚至宕机，从而影响其他业务。

大Key和热Key产生的原因

未正确使用Redis、业务规划不足、无效数据的堆积、访问量突增等都会产生大Key与热Key，如：

大key
- 在不适用的场景下使用Redis，易造成Key的value过大，如使用String类型的Key存放大体积二进制文件型数据；
- 业务上线前规划设计不足，没有对Key中的成员进行合理的拆分，造成个别Key中的成员数量过多；
- 未定期清理无效数据，造成如HASH类型Key中的成员持续不断地增加；
- 使用LIST类型Key的业务消费侧发生代码故障，造成对应Key的成员只增不减。
热key
- 预期外的访问量陡增，如突然出现的爆款商品、访问量暴涨的热点新闻、直播间某主播搞活动带来的大量刷屏点赞、游戏中某区域发生多个工会之间的战斗涉及大量玩家等。

快速找出大Key和热Key行

方法	优缺点	说明
通过redis-cli的bigkeys和hotkeys参数查找大Key和热Key	优点：方便、快速、安全。缺点：分析结果不可定制化，准确性与时效性差。	redis-cli提供了bigkeys与hotkeys参数能够以遍历的方式分析Redis实例中的所有Key，并返回Key的整体统计信息与每个数据类型中Top1的大Key。以bigkeys为例，其仅能分析并输入六种数据类型（STRING、LIST、HASH、SET、ZSET、STREAM），命令示例为`redis-cli -h r-*************.redis.rds.aliyuncs.com -a <password> --bigkeys`。说明若您只需要分析STRING类型的大key或是找出成员数量超过10个的HASH Key，则bigkeys**参数无法直接实现该类需求。
通过Redis内置命令对目标Key进行分析	优点：方便、对线上服务影响小。缺点：返回的Key序列化长度并不等同于它在内存空间中的真实长度，因此不够准确，仅可作为参考。	对不同数据类型的目标Key，分别通过如下风险较低的命令进行分析，来判断目标Key是否符合大Key判定标准。STRING类型：执行STRLEN命令，返回对应Key的value的字节数。LIST类型：执行LLEN命令，返回对应Key的列表长度。HASH类型：执行HLEN命令，返回对应Key的成员数量。SET类型：执行SCARD命令，返回对应Key的成员数量。ZSET类型：执行ZCARD命令，返回对应Key的成员数量。STREAM类型：执行XLEN命令，返回对应Key的成员数量。说明DEBUG OBJECT与MEMORY USAGE命令在执行时需占用较多资源，且时间复杂度为O(N)，有阻塞Redis实例的风险，不建议使用。
通过业务层定位热Key	优点：可准确并及时地定位热Key。缺点：业务代码复杂度的增加，同时可能会降低一些性能。	通过在业务层增加相应的代码对Redis的访问进行记录并异步汇总分析。自己的项目业务自己应该是清除，哪块容易出现热key会有一个大致的判断也
通过redis-rdb-tools工具以定制化方式找出大Key	优点：支持定制化分析，对线上服务无影响。缺点：时效性差，RDB文件较大时耗时较长。	Redis-rdb-tools是通过Python编写，支持定制化分析Redis RDB快照文件的开源工具。您可以根据您的精细化需求，全面地分析Redis实例中所有Key的内存占用情况，同时也支持灵活地分析查询。
通过MONITOR命令找出热Key	优点：方便、安全。缺点：会占用CPU、内存、网络资源，时效性与准确性较差。	Redis的MONITOR命令能够忠实地打印Redis中的所有请求，包括时间信息、Client信息、命令以及Key信息。在发生紧急情况时，可以通过短暂执行MONITOR命令并将返回信息输入至文件，在关闭MONITOR命令后，对文件中请求进行归类分析，找出这段时间中的热Key。说明由于MONITOR命令对Redis实例性能消耗较大，非特殊情况不推荐使用MONITOR命令。

之前也有了解过京东的一个开源项目可以进行热key的一个监控

https://gitee.com/jd-platform-opensource/hotkey

介绍

对任意突发性的无法预先感知的热点请求，包括并不限于热点数据（如突发大量请求同一个商品）、热用户（如爬虫、刷子）、热接口（突发海量请求同一个接口）等，进行毫秒级精准探测到。然后对这些热数据、热用户等，推送到该应用部署的所有机器JVM内存中，以大幅减轻对后端数据存储层的冲击，并可以由客户端决定如何使用这些热key（譬如对热商品做本地缓存、对热用户进行拒绝访问、对热接口进行熔断或返回默认值）。这些热key在整个应用集群内保持一致性。

核心功能：热数据探测并推送至集群各个服务器

适用场景：

1 mysql热数据本地缓存

2 redis热数据本地缓存

3 黑名单用户本地缓存

4 爬虫用户限流

5 接口、用户维度限流

6 单机接口、用户维度限流

7 集群用户维度限流

8 集群接口维度限流

优化大Key与热Key

类别	处理方法
大Key	1.对大Key进行拆分例如将含有数万成员的一个HASH Key拆分为多个HASH Key，并确保每个Key的成员数量在合理范围。在Redis集群架构中，拆分大Key能对数据分片间的内存平衡起到显著作用。 2. 对大Key进行清理将不适用Redis能力的数据存至其它存储，并在Redis中删除此类数据。说明: Redis 4.0及之后版本：您可以通过UNLINK命令安全地删除大Key甚至特大Key，该命令能够以非阻塞的方式，逐步地清理传入的Key。 Redis 4.0之前的版本：建议先通过SCAN命令读取部分数据，然后进行删除，避免一次性删除大量key导致Redis阻塞。 3.监控Redis的内存水位接入普罗米修斯（Prometheus）进行集成实现监控 4.对过期数据进行定期清理堆积大量过期数据会造成大Key的产生，例如在HASH数据类型中以增量的形式不断写入大量数据而忽略了数据的时效性。可以通过定时任务的方式对失效数据进行清理。说明：在清理HASH数据时，建议通过HSCAN命令配合HDEL命令对失效数据进行清理，避免清理大量数据造成Redis阻塞。
热Key	1. 在Redis集群架构中对热Key进行复制在Redis集群架构中，由于热Key的迁移粒度问题，无法将请求分散至其他数据分片，导致单个数据分片的压力无法下降。此时，可以将对应热Key进行复制并迁移至其他数据分片，例如将热Key foo复制出3个内容完全一样的Key并名为foo2、foo3、foo4，将这三个Key迁移到其他数据分片来解决单个数据分片的热Key压力。说明：该方案的缺点在于需要联动修改代码，同时带来了数据一致性的挑战（由原来更新一个Key演变为需要更新多个Key），仅建议该方案用来解决临时棘手的问题。 2. 使用读写分离架构如果热Key的产生来自于读请求，您可以将实例改造成读写分离架构来降低每个数据分片的读请求压力，甚至可以不断地增加从节点。但是读写分离架构在增加业务代码复杂度的同时，也会增加Redis集群架构复杂度。不仅要为多个从节点提供转发层（如Proxy，LVS等）来实现负载均衡，还要考虑从节点数量显著增加后带来故障率增加的问题。Redis集群架构变更会为监控、运维、故障处理带来了更大的挑战。 3. 使用本地缓存当监听到热key的时候，可以使用本地缓存，比如使用Guava的LoadingCache

类别

处理方法

大Key

1.对大Key进行拆分
例如将含有数万成员的一个HASH Key拆分为多个HASH Key，并确保每个Key的成员数量在合理范围。在Redis集群架构中，拆分大Key能对数据分片间的内存平衡起到显著作用。
2. 对大Key进行清理
将不适用Redis能力的数据存至其它存储，并在Redis中删除此类数据。
说明:
Redis 4.0及之后版本：您可以通过UNLINK命令安全地删除大Key甚至特大Key，该命令能够以非阻塞的方式，逐步地清理传入的Key。
Redis 4.0之前的版本：建议先通过SCAN命令读取部分数据，然后进行删除，避免一次性删除大量key导致Redis阻塞。
3.监控Redis的内存水位
接入普罗米修斯（Prometheus）进行集成实现监控
4.对过期数据进行定期清理
堆积大量过期数据会造成大Key的产生，例如在HASH数据类型中以增量的形式不断写入大量数据而忽略了数据的时效性。可以通过定时任务的方式对失效数据进行清理。
说明：在清理HASH数据时，建议通过HSCAN命令配合HDEL命令对失效数据进行清理，避免清理大量数据造成Redis阻塞。

热Key

1. 在Redis集群架构中对热Key进行复制
在Redis集群架构中，由于热Key的迁移粒度问题，无法将请求分散至其他数据分片，导致单个数据分片的压力无法下降。此时，可以将对应热Key进行复制并迁移至其他数据分片，例如将热Key foo复制出3个内容完全一样的Key并名为foo2、foo3、foo4，将这三个Key迁移到其他数据分片来解决单个数据分片的热Key压力。
说明： 该方案的缺点在于需要联动修改代码，同时带来了数据一致性的挑战（由原来更新一个Key演变为需要更新多个Key），仅建议该方案用来解决临时棘手的问题。
2. 使用读写分离架构
如果热Key的产生来自于读请求，您可以将实例改造成读写分离架构来降低每个数据分片的读请求压力，甚至可以不断地增加从节点。但是读写分离架构在增加业务代码复杂度的同时，也会增加Redis集群架构复杂度。不仅要为多个从节点提供转发层（如Proxy，LVS等）来实现负载均衡，还要考虑从节点数量显著增加后带来故障率增加的问题。Redis集群架构变更会为监控、运维、故障处理带来了更大的挑战。
3. 使用本地缓存
当监听到热key的时候，可以使用本地缓存，比如使用Guava的LoadingCache

Guava的LoadingCache示例

import com.google.common.cache.CacheBuilder;
import com.google.common.cache.CacheLoader;
import com.google.common.cache.LoadingCache;

import java.util.concurrent.ExecutionException;
import java.util.concurrent.TimeUnit;

public class LocalCacheForHotKey {

    public static void main(String[] args) {
        // 创建一个本地缓存
        LoadingCache<String, String> cache = CacheBuilder.newBuilder()
               .maximumSize(1000) // 设置缓存的最大容量
               .expireAfterWrite(10, TimeUnit.MINUTES) // 设置数据写入 10 分钟后过期
               .build(new CacheLoader<String, String>() {
                    @Override
                    public String load(String key) {
                        // 从实际的数据源加载数据，如果缓存中没有
                        return loadDataFromSource(key);
                    }
                });

        // 模拟获取热 Key 的值
        try {
            String value = cache.get("hotKey");
            System.out.println("Value for hotKey: " + value);
        } catch (ExecutionException e) {
            e.printStackTrace();
        }
    }

    public static String loadDataFromSource(String key) {
        // 模拟从数据源加载数据的逻辑
        return "Data for " + key;
    }
}

参考：https://help.aliyun.com/zh/redis/user-guide/identify-and-handle-large-keys-and-hotkeys

救救孩子把

关注

17
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
发现并处理Redis的大Key和热Key

名词解释大Key通常以Key的大小和Key中成员的数量来综合判定，例如：Key本身的数据量过大：一个String类型的Key，它的值为5 MB。Key中的成员数过多：一个ZSET类型的Key，它的成员数量为10,000个。Key中成员的数据量过大：一个Hash类型的Key，它的成员数量虽然只有2,000个但这些成员的Value（值）总大小为100 MB。
复制链接

扫一扫