Redis删除策略
过期数据
什么是过期策略
Redis当中数据的特征
- redis是一种内存级数据库,所有数据均存放在内存当中,内存中的数据可以通过TTL指令获取数据的状态
- XX:具有时效性的数据
- -1: 永久有效的数据
- -2:已经过期的数据 或 被删除的数据 或 未定义的数据
过期数据删除策略
时效性数据的储存结构
在Redis的存储空间当中,存储的内容是数据名称+数据,对于每一个数据都存在一个地址,党数据设置时间限制的时候,expires空间当中存放数据的地址和对应的时间,当时间到达某个时间的时候,根据这个地址删除储存空间的数据,同时expires当中的相应字段也删除。
但是这里的删除也不是百分百及时的把数据删除,而是在内存占用和CPU达到一个平衡的状态。在CPU忙的时候,就延缓数据的删除,等到CPU有空闲的时候,再去维护内存,把过期的数据删除,这样可以提高CPU的利用效率。
数据删除策略的目标
在内存占用的CPU占用之前寻找一种平衡,顾此失彼都会造成整个redis性能的下降,甚至引发服务器宕机或者内存泄漏。
删除策略分类
定时删除
Redis存储空间当中存放的是数据名称+数据,expires当中存数据的地址和到期时间,当数据到达到期时间,在redis当中,把数据立刻删除,同时把expires里面也把这个地址删除。
- 创建定时器,当key设置有过期数据,且过期时间到达时,由定时器任务立即执行对键的删除操作
- 优点:节约内存、到时就删除、快速释放掉不必要的内存占用
- 缺点:CPU内存压力大,无论CPU此时的负载量多高,都占用CPU,会影响redis服务器响应时间和指令吞吐量
- 总结:用处理器性能换取存储空间(时间换空间),牺牲CPU的处理时长来保证内存能最大化的释放掉。
惰性删除
- 数据到达过期时间,不做处理,等下次访问该数据时
- 如果数据没过期,返回数据
- 发现已经过期,删除,返回不存在
- 优点:节约CPU性能,发现必须删除的时候才删除
- 缺点:内存压力大,出现长期占用内存的数据
- 总结:用存储空间换取处理器的性能(拿时间换空间),牺牲CPU的空间来换取CPU的运行速度。
刚才看的这两种都是不太好的方法,一个是时间换空间,一个是空间换时间,那有没有一种折中的办法呢?
定期删除
定期删除的redis结构:redis的存储空间内容有多个expire空间,每个当中存放多个地址+时间的信息
- redis启动服务器初始化时,读取配置server.hz 的值,默认是10
- 每秒钟执行server.hz次
serverCron()
其中调用databaseCron()
其中调用activeExpireCycle()
activeExpireCycle()
对每个expires[*]进行逐一检测,每次执行250ms/server.hz次- 对某个expire[*]检测的时候,随机挑选W个key检测
- 当key超时,删除key
- 如果在这一轮当中删除key的数量 > W * 25%,再次循环扫描
- 如果在这一轮当中删除key的数量 <= W * 25%,检查下一个expire[], 0-15循环
- W取值=ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP属性值
- 参数current_db用于记录activeExpireCycle() 进入哪个expire[*]执行
- 如果activeExpireCycle()执行时间到期,下次从current_db继续向下执行
redis对expire进行轮询,使用current_db记录下一次的开始位置,下一次轮询是从这个位置开始,不是从第一个位置开始拿。sever.hz的设置到配置文件里面去设置。
对于定期删除的总结
- 周期性轮询redis库中的时效性数据,采用随机抽取的策略,利用过期数据占比方式控制删除频度
- 特点1:CPU性能占用设置有峰值,检测频度可以设置
- 特定2:内存压力不是很大,长期占用内存的冷数据会被持续清理
- 总结:周期性抽查存储空间(随机抽查、重点抽查)
三种策略的对比:
删除策略 | 内存占用 | CPU利用 | 时间、空间占用 |
---|---|---|---|
定时删除 | 节约内存,无占用 | 不分时段占用CPU资源,频度高 | 时间换空间 |
惰性删除 | 内存占用严重 | 延时执行,CPU执行效率高 | 空间换时间 |
定期删除 | 内存定期随机清理 | 每秒花费固定的CPU资源维护内存 | 随机抽查,重点抽查 |
数据逐出
删除策略控制的对象是expires,控制的是有时效性的数据,已经到期并且还占用内存的数据。
但是当全部都是长期存放在内存当中的时候,肯定有内存满的问题,所以,在没有剩下的内存空间的时候怎么做。
新数据进入检测
- Redis使用内存存储数据,在执行每一个命令前, 会调用
freeMemorylfNeeded()
检测内存是否充足。如果内存不满足新加入数据的最低存储要求,redis要临时删除一些数据为当前指令清理存储空间。 清理数据的策略称为逐出算法。 - 注意:逐出数据的过程不是100%能够清理出足够的可使用的内存空间,如果不成功则反复执行。当对所有数据尝试完毕后,如果不能达到内存清理的要求,将出现错误信息。
(error) OOM command not allowed when used memory > 'maxmemory'
影响数据逐出的相关配置
-
最大可使用内存
maxmemory
占用物理内存的比例,默认值为0,表示不限制。生产环境中根据需求设定,通常设置在50%以上。 -
每次选取待删除数据的个数
maxmemory- sample s
选取数据时并不会全库扫描,导致严重的性能消耗,降低读写性能。因此采用随机获取数据的方式作为待检测删除数据 -
删除策略
maxmemory -policy
达到最大内存后的,对被挑选出来的数据进行删除的策略 -
检测易失数据(可能会过期的数据集server.db[i].expires )
- volatile-lru: 挑选最近最少使用的数据淘汰
- volatile-lfu: 挑选最近使用次数最少的数据淘汰
- volatile-ttl: 挑选将要过期的数据淘汰
- volatile-random: 任意选择数据淘汰
-
检测全库数据(所有数据集server.db[j].dict )
- allkeys-ru: 挑选最近最少使用的数据淘汰
- allkeys-lfu:挑选最近使用次数最少的数据淘汰
- allkeys-random: 任意选择数据淘汰
-
放弃数据驱逐
- no-enviction (驱逐) :禁止驱逐数据(redis4.0中默认策略) , 会引发错误OOM (OutOf Memory)
数据逐出策略配置依据
- 使用INFO命令输出监控信息,查询缓存hit和miss的次数,根据业务需求调优Redis配置
后面的这一堆现在我还没办法测试,需要大量数据的支持,所以代码演示就不写了。
逐出策略和删除策略的区分:删除策略针对的对象是有时效性的数据、逐出策略针对的是内存满的时候如何处理,怎样替换。
本文写到这里,谢谢你可以看到本文文末,thank you!!!