概述
Redis是一种内存级数据库,那么它就要具备及时删除功能。因为内存的容量限制了数据不能随意增大。磁盘可以做的很大,但内存不能做的很大。
Redis可以设置带有期限的数据(例如:setex key second value 命令),相应的我们可以通过ttl key命令的返回值查看数据的期限状态:
- xx(大与0的数字):表示该数据剩余的期限时间
- -1:表示该数据没有设置过期时间,是永久性的
- -2:已过期的数据、已删除的数据或未定义的数据
那么对于已过期的数据,Redis什么时候删除呢。
先看Redis时效性数据的存储结构:
在Redis的存储空间中,每个key对应的数据存储的内存地址,而对于数据存储区域expires,里面每一个地址对应一个时间期限。对于那些要删除的key,Redis查找相应的内存地址,然后查找时间期限。
定时删除
创建一个定时器,对key设置过期时间,当达到过期时间时,有CPU立即删除数据。
- 优点:不会占用内存资源,节省空间
- 缺点:此时不管CPU占用率多高(多忙),都立即执行删除。会影响Redis服务响应时间和指令吞吐量
以时间换空间
惰性删除
对于过期数据不做处理,当使用该数据时
- 如果为过期,则返回该数据
- 如果过期,删除数据,返回空
特点:
- 优点:节省CPU资源,发现必须删除时才删除
- 缺点:内存占有量大,会出现长期不用的数据未删除现象
原理:在每次执行get操作时,首先会执行一个expireIfNeeded()函数,该函数就是为了检查数据的期限性。
定期删除
以上两种策略的方案都走极端,那么就会有一种折中方案:定期删除
Redis服务在启动的时候会读取redis.conf配置文件中的server.hz的值,改值默认为10.
Redis会在每秒钟执行server.hz次的serverCron()函数,该函数会调用databaseCron()函数,databaseCron()函数会调用activeExpireCycle()函数。
- activeExpireCycle():对每个expire[*],逐一进行检测每次执行250ms/server.hz时长。对每个expire检测时,随机挑选W个key进行检测
- 如果key超时,删除key
- 如果一轮中删除key的数量>W*25%,循环该过程
- 如果一轮中删除key的数量<W*25%,检测下一个expire
- 参数current_db用于记录activeExpireCycle()进入那个expire执行,如果执行到期,下次从current_db继续向下执行。