redis:删除数据后,为什么内存占用率还是很高

引入

  • 在使用 Redis 时,我们经常会遇到这样一个问题:明明做了数据删除,数据量已经不大了,为什么使用 top 命令查看时,还会发现 Redis 占用了很多内存呢?

  • 实际上,这是因为,当数据删除后,redis释放的内存空间会由内存分配器管理,并不会立即返回给操作系统。所以,操作系统仍然会记录着redis分配了大量的内存

  • 但是,这往往会伴随着一个潜在的风险点:redis释放的内存空间可能不是连续的,那么,这些不连续的内存空间很有可能出于一种闲置的状态。这就会导致一个问题:虽然有空闲空间,redis却无法用来保存数据,不仅会减少redis能够实际保存的数据量,还会降低redis运行机器的成本回报率。

问题:为什么数据已经删除了,但内存却闲置着没有用呢?有什么解决方案吗?

什么是内存碎片

通常情况下,内存空间闲置,往往是因为操作系统发生了比较严重的内存碎片。那什么是内存碎片呢?虽然操作系统的剩余内存空间总量足够,但是,应用申请的是一块连续地址空间的 N 字节,但在剩余的内存空间中,没有大小为 N 字节的连续空间了,那么,这些剩余空间就是内存碎片
在这里插入图片描述
问题是,redis中的内存碎片是什么原因导致的呢?

内存碎片是如何形成的?

其实,内存碎片的形成有内因和外因两个层面的原因。简单来说,内因是操作系统的内存分配机制,外因是redis的负载特性

内因:内存分配器的分配策略

内存分配器的分配策略就决定了操作系统无法做到“按需分配”。这是因为,内存分配器一般是按照固定大小来分配内存的,而不是完全按照应用程序申请的内存空间大小给程序分配

Redis 可以使用 libc、jemalloc、tcmalloc 多种内存分配器来分配内存,默认使用jemalloc。以jemalloc为例:

  • jemalloc的分配策略之一,就是按照一系列固定的大小划分内存空间,比如8字节、16字节、32字节、48 字节,…, 2KB、4KB、8KB 等。当程序申请的内存最接近某个固定值时,jemalloc会给它分配相应大小的空间
  • 这样的分配方式本身是为了减少分配次数。例如,Redis 申请一个 20 字节的空间保存数据,jemalloc 就会分配 32 字节,此时,如果应用还要写入 10 字节的数据,Redis 就不用再向操作系统申请空间了,因为刚才分配的 32 字节已经够用了,这就避免了一次分配操作。

但是,如果 Redis 每次向分配器申请的内存空间大小不一样,这种分配方式就会有形成碎片的风险,而这正好来源于 Redis 的外因了。

外因:键值对大小不一样和删改操作

redis通常作为共用的缓存系统或者键值数据库对外提供服务,所以,不同业务应用的数据都可能保存在redis中,这就会带来不同大小的键值对。这样一来,redis申请内存空间分配时,本身就会有大小不一的空间需求,这是第一个外因。

但是内存分配器只能按照固定大小分配内存,所以,分配的内存空间一半都会比申请的空间大一些,不会完全一致,这本身就会造成一定的碎片,降低内存空间存储效率

比如说,应用 A 保存 6 字节数据,jemalloc 按分配策略分配 8 字节。如果应用 A 不再保存新数据,那么,这里多出来的 2 字节空间就是内存碎片了,如下图所示:

在这里插入图片描述
第二个外因是,这些键值对会被修改和删除,这会导致空间的扩容和释放。具体来说,一方面,如果修改后的键值对变大或者变小了,就需要占用额外的空间或者不用的空间。另一方面,删除的键值对就不再需要内存空间了,此时,就会把空间释放出来,形成空间空间。如下图:

在这里插入图片描述
大量内存碎片的存在,会造成 Redis 的内存实际利用率变低

如何判断是否有内存碎片

Redis 是内存数据库,内存利用率的高低直接关系到 Redis 运行效率的高低。为了让用户能监控到实时的内存使用情况,Redis 自身提供了 INFO 命令,可以用来查询内存使用的详细信息,命令如下:

INFO memory
# Memory
used_memory:1073741736
used_memory_human:1024.00M
used_memory_rss:1997159792
used_memory_rss_human:1.86G
…
mem_fragmentation_ratio:1.86

这里有一个 mem_fragmentation_ratio 的指标,它表示的就是 Redis 当前的内存碎片率。那么,这个碎片率是怎么计算的呢?其实,就是上面的命令中的两个指标
used_memory_rss 和 used_memory 相除的结果。

mem_fragmentation_ratio = used_memory_rss/ used_memory

used_memory_rss 是操作系统实际分配给 Redis 的物理内存空间,里面就包含了碎片;而 used_memory 是 Redis 为了保存数据实际申请使用的空间。

举个例子,例如,Redis 申请使用了 100 字节(used_memory),操作系统实际
分配了 128 字节(used_memory_rss),此时,mem_fragmentation_ratio 就是
1.28。

那么,知道了这个指标,我们该如何使用呢?

  • mem_fragmentation_ratio 大于 1 但小于 1.5。这种情况是合理的。这是因为,内存碎片是难以避免的。毕竟,内因的内存分配器是一定要使用的,分配策略
    都是通用的,不会轻易修改;而外因由 Redis 负载决定,也无法限制。所以,存在内存碎片也是正常的。
  • mem_fragmentation_ratio 大于 1.5 。这表明内存碎片率已经超过了 50%。一般情况下,这个时候,我们就需要采取一些措施来降低内存碎片率了。

如何清理内存碎片

当 Redis 发生内存碎片后,一个“简单粗暴”的方法就是重启 Redis 实例。当然,这并不是一个“优雅”的方法,毕竟,重启 Redis 会带来两个后果:

  • 如果redis中的数据没有持久化,那么,数据就会丢失
  • 即使redis数据持久化了,我们还需要通过AOF和RDB进行恢复,恢复时长取决于AOF或者RDB的大小,如果只有一个redis实例,恢复阶段无法提供服务

所以,还有什么其他方法吗?从 4.0-RC3 版本以后,Redis 自身提供了一种内存碎片自动清理的方法。

内存碎片清理,简单来说,就是“搬家让位,合并空间”。

  • 这么一说,碎片清理的机制就很容易理解了。当有数据把一块连续的内存空间分割成好几块不连续的空间时,操作系统就会把数据拷贝到别处。
  • 此时,数据拷贝需要能把这些数据原来占用的空间都空出来,把原本不连续的内存空间变成连续的空间。
  • 否则,如果数据拷贝后,并没有形成连续的内存空间,这就不能算是清理了。

在这里插入图片描述
不过,内存碎片清理是有代价的

  • 操作系统需要把多份数据拷贝到新位置,把原有空间释放出来,这会带来时间开销。因为redis是单线程,在数据拷贝时,redis只能等着,这就导致redis无法及时处理请求,性能就会降低。
  • 而且有的时候,数据拷贝还需要注意顺序,比如操作系统需要先拷贝 D,并释放 D的空间后,才能拷贝 B。这种对顺序性的要求,会进一步增加redis的等待时间,导致性能降低。

那么,有什么方法可以尽量缓解这个问题呢?为此redis专门为自动内存碎片清理功能设置了参数。我们可以通过设置参数,来控制碎片清理的开始和结束时机,以及占用的CPU比例,从而减少碎片清理时对redis本身请求处理的性能影响。

(1)首先,redis需要启动自动内存碎片清理,可以把activedefrag 配置项设置为 yes,命令如下:

 config set activedefrag yes

这个命名只是启动了自动清理功能,但是,具体什么时候清理,会受到下面两个参数影响。这两个参数分别设置了触发内存清理的一个条件,如果同时满足这两个条件,就开始清理。在清理工程中,只要有一个条件不满足了,就停止自动清理

  • active-defrag-ignore-bytes 100mb:表示内存碎片的字节数达到 100MB 时,开始清理;
  • active-defrag-threshold-lower 10:表示内存碎片空间占操作系统分配给 Redis 的总空间比例达到 10% 时,开始清理。

为了尽可能的减少碎片清理对redis正常请求处理的影响,自动内存碎片清理功能在执行时,还会监控清理操作占用的CPU时间,而且还设置了两个参数,分别用于控制清理操作占用的 CPU 时间比例的上、下限,既保证清理工作能正常进行,又避免了降低 Redis 性能。这两个参数具体如下:

  • active-defrag-cycle-min 25: 表示自动清理过程所用 CPU 时间的比例不低于25%,保证清理能正常开展;
  • active-defrag-cycle-max 75:表示自动清理过程所用 CPU 时间的比例不高于
    75%,一旦超过,就停止清理,从而避免在清理时,大量的内存拷贝阻塞 Redis,导致响应延迟升高。

自动内存碎片清理机制在控制碎片清理启停的时机上,既考虑了碎片的空间占比、对Redis 内存使用效率的影响,还考虑了清理机制本身的 CPU 时间占比、对 Redis 性能的影响。而且,清理机制还提供了 4 个参数,让我们可以根据实际应用中的数据量需求和性能要求灵活使用,建议你在实践中好好地把这个机制用起来。

注意:内存碎片自动清理涉及内存拷贝,这对 Redis 而言,是个潜在的风险。如果你在实践过程中遇到 Redis 性能变慢,记得通过日志看下是否正在进行碎片清理。如果 Redis 的确正在清理碎片,那么,建议你调小 active-defrag-cyclemax 的值,以减轻对正常请求处理的影响。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值