- 当数据删除后,Redis释放的内存空间由内存分配器管理,并不会立即返回给操作系统。所以操作系统仍然会记录着给redis分配了大量内存。
- Redis释放的内存空间可能并不是连续的,这些不连续的空间很可能处于闲置状态,Redis无法用这些空间来保存数据,不仅会减少Redis能够实际保存的数据量,还会降低运行机器的成本回报率。
内存碎片
- 操作系统的剩余内存空间总量足够,但是是分散的。而应用申请的是一块连续地址空间的N字节,在剩余的内存空间中,没有大小为N字节的连续空间了,这些剩余空间就是内存碎片。
- 内存碎片的形成有内因和外因两个层面的原因,内因是操作系统的内存分配机制,外因是Redis的负载特征
- 内存分配器的分配策略决定操作系统无法做到
按需分配
,这是因为内存分配器一般是按照固定大小来分配内存,而不是完全按照应用程序申请的内存空间大小给程序分配。 - 以Redis默认使用的jemalloc为例,jemalloc 的分配策略之一,是按照一系列固定的大小划分内存空间,例如 8 字节、16 字节、32 字节、48 字节,…, 2KB、4KB、8KB 等。
当程序申请的内存最接近某个固定值时,jemalloc 会给它分配相应大小的空间。这样的分配方式本身是为了减少分配次数
。例如,Redis 申请一个 20 字节的空间保存数据,jemalloc 就会分配 32 字节,此时,如果应用还要写入 10 字节的数据,Redis 就不用再向操作系统申请空间了,因为刚才分配的 32 字节已经够用了,这就避免了一次分配操作。 - Redis的键值对大小通常不会一模一样,且还伴有删改操作。
如何查看
10.138.45.247:8379> INFO memory
# Memory
used_memory:22695472
used_memory_human:21.64M
used_memory_rss:46100480
used_memory_rss_human:43.96M
used_memory_peak:255139672
used_memory_peak_human:243.32M
total_system_memory:16658345984
total_system_memory_human:15.51G
used_memory_lua:37888
used_memory_lua_human:37.00K
maxmemory:0
maxmemory_human:0B
maxmemory_policy:noeviction
mem_fragmentation_ratio:2.03
mem_allocator:jemalloc-4.0.3
- 这里有一个
mem_fragmentation_ratio
的指标,它表示的就是 Redis 当前的内存碎片率。那么,这个碎片率是怎么计算的呢?其实,就是上面的命令中的两个指标used_memory_rss
和 used_memory
相除的结果。 mem_fragmentation_ratio = used_memory_rss/ used_memory
used_memory_rss 是操作系统实际分配给 Redis 的物理内存空间,里面就包含了碎片;而 used_memory 是 Redis 为了保存数据实际申请使用的空间。mem_fragmentation_ratio 大于 1 但小于 1.5
。这种情况是合理的。毕竟,内因的内存分配器是一定要使用的,分配策略都是通用的,不会轻易修改;而外因由 Redis 负载决定,也无法限制。所以,存在内存碎片也是正常的。mem_fragmentation_ratio 大于 1.5
。这表明内存碎片率已经超过了 50%。一般情况下,这个时候就需要采取一些措施来降低内存碎片率了。
如何清理
- 简单粗暴的做法是重启redis实例。但是会有两个后果:
- 如果数据没有持久化,则数据就会丢失。
- 即便数据持久化了,还需要通过AOF或RDB文件进行恢复,恢复时长取决于持久化文件的大小。如果只有一个Redis实例,恢复阶段无法提供服务。
- 从 4.0-RC3 版本以后,Redis 自身提供了一种内存碎片自动清理的方法。
- 内存碎片清理,当有数据把一块连续的内存空间分割成好几块不连续的空间时,操作系统就会把数据拷贝到别处。此时,数据拷贝需要能把这些数据原来占用的空间都空出来,把原本不连续的内存空间变成连续的空间。否则,如果数据拷贝后,并没有形成连续的内存空间,这就不能算是清理了
- 碎片清理是有代价的,操作系统需要把多份数据拷贝到新位置,把原有空间释放出来,这会带来时间开销。因为 Redis 是单线程,在数据拷贝时,Redis 只能等着,这就导致 Redis 无法及时处理请求,性能就会降低。
- 而且,有的时候,数据拷贝还需要注意顺序,就像刚刚说的清理内存碎片的例子,操作系统需要先拷贝 D,并释放 D 的空间后,才能拷贝 B。这种对顺序性的要求,会进一步增加 Redis 的等待时间,导致性能降低。
- 可以通过设置参数,来控制碎片清理的开始和结束时机,以及占用的 CPU 比例,从而减少碎片清理对 Redis 本身请求处理的性能影响。
- 首先,Redis 需要启用自动内存碎片清理,可以把 activedefrag 配置项设置为 yes:
config set activedefrag yes
- 这个命令只是启用了自动清理功能,但是,具体什么时候清理,会受到下面这两个参数的控制。
- 如果同时满足这两个条件,就开始清理。在清理的过程中,只要有一个条件不满足了,就停止自动清理。
active-defrag-ignore-bytes 100mb
:表示内存碎片的字节数达到 100MB 时,开始清理;active-defrag-threshold-lower 10
:表示内存碎片空间占操作系统分配给 Redis 的总空间比例达到 10% 时,开始清理。- 为了尽可能减少碎片清理对 Redis 正常请求处理的影响,自动内存碎片清理功能在执行时,还会监控清理操作占用的 CPU 时间,而且还设置了两个参数,
分别用于控制清理操作占用的 CPU 时间比例的上、下限,既保证清理工作能正常进行,又避免了降低 Redis 性能
。 active-defrag-cycle-min 25
: 表示自动清理过程所用 CPU 时间的比例不低于 25%,保证清理能正常开展;active-defrag-cycle-max 75
:表示自动清理过程所用 CPU 时间的比例不高于 75%,一旦超过,就停止清理,从而避免在清理时,大量的内存拷贝阻塞 Redis,导致响应延迟升高。