一、前言
- 在文章开始之前,我先问大家一个问题:当我们使用指令:
expire key second
给一个key设置过期时间,过期时间一到,这个key对应的过期数据
真的被服务器立即删除了吗?答案是并不会立即删除。知道了这个答案,就来看看Redis中如何处理过期的数据。
二、Redis中的数据特征
- Redis是一种内存级数据库,所有数据均存放在内存中,内存中的数据可以通过TTL指令获取其状态,有三种状态:
指令结果 | 状态 |
---|---|
XX | 具有时效性的数据 |
-1 | 永久有效的数据 |
-2 | 已经过期的数据 或 被删除的数据 或 未定义的数据 |
三、时效性数据储存结构
当我们用指令设置过期数据后,数据对应的地址会放在expires空间中,存储方式是哈希,存储的value是过期时间。
四、、数据删除策略
数据删除策略目标:
在内存占用与CPU占用之间寻找一种平衡,顾此失彼都会造成整体redis性能的下降,甚至引发服务器宕机或内存泄露
1、定时删除
- 创建一个定时器,当key设置有过期时间,且过期时间到达时,由定时器任务立即执行对键的删除操作
- 优点:节约内存,到时就删除,快速释放掉不必要的内存占用
- 缺点:CPU压力很大,无论CPU此时负载量多高,均占用CPU,会影响redis服务器响应时间和指令吞吐量
2、惰性删除
- 数据到达过期时间,不做处理。等下次访问该数据时,会调用
expireIfNeeded()
函数来判断该数据是否过期:
如果未过期,返回数据
发现已过期,删除,返回不存在 - 优点:节约CPU性能,发现必须删除的时候才删除
- 缺点:内存压力很大,出现长期占用内存的数据
3、定期删除
流程分析:
- Redis服务器启动初始化时,读取配置server.hz的值,默认为10
- 然后每秒钟执行10次
serverCron()
方法,该方法用来检测服务器 serverCron()
方法又会调用databasesCron()
方法,该方法是用来遍历数据库的,redis默认有16个数据库,从第一个数据库开始databasesCron()
方法又会调用activeExpireCycle()
方法,该方法会对每一个expires[*]
逐一进行检测,每次执行250ms/server.hz;对某个expires[*]
检测时,随机挑选W个key检测- 如果检测到key超时,则删除key;如果一轮中删除的key的数量>W25%,循环该过程;如果一轮中删除的key的数量≤W25%,检查下一个
expires[*]
,0-15循环。其中W取值=ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP属性值 - 如果activeExpireCycle()执行时间到期,下次从current_db继续向下执行
- 参数current_db用于记录activeExpireCycle() 进入哪个expires[*] 执行
总结:
周期性轮询redis库中的时效性数据,采用随机抽取的策略,利用过期数据占比的方式控制删除频度- 内存压力不是很大,长期占用内存的冷数据会被持续清理
五、删除策略对比
定时删除 | 节约内存,无占用 | 不分时段占用CPU资源,频度高 | 拿时间换空间 |
---|---|---|---|
惰性删除 | 内存占用严重 | 延时执行,CPU利用率高 | 拿空间换时间 |
定期删除 | 内存定期随机清理 | 每秒花费固定的CPU资源维护内存 | 随机抽查,重点抽查 |
六、逐出算法
1、概念引入
当新数据进入redis时,如果内存不足怎么办?Redis使用内存存储数据,在执行每一个命令前,会调用freeMemoryIfNeeded()
检测内存是否充足。如果内存不满足新加入数据的最低存储要求,redis要临时删除一些数据为当前指令清理存储空间。清理数据的策略称为逐出算法。
注意:逐出数据的过程不是100%能够清理出足够的可使用的内存空间,如果不成功则反复执行。当对所有数据尝试完毕后,如果不能达到内存清理的要求,将出现错误信息。
2、八种配置
- 检测易失数据(
可能会过期的数据集server.db[i].expires
)
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
opics/618545628)**
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!