追求性能极致 - Redis:LFU内存淘汰算法分析

作者简介:大家好,我是smart哥,前中兴通讯、美团架构师,现某互联网公司CTO

联系qq:184480602,加我进群,大家一起学习,一起进步,一起对抗互联网寒冬

学习必须往深处挖,挖的越深,基础越扎实!

阶段1、深入多线程

阶段2、深入多线程设计模式

阶段3、深入juc源码解析


阶段4、深入jdk其余源码解析


阶段5、深入jvm源码解析

码哥源码部分

码哥讲源码-原理源码篇【2024年最新大厂关于线程池使用的场景题】

码哥讲源码【炸雷啦!炸雷啦!黄光头他终于跑路啦!】

码哥讲源码-【jvm课程前置知识及c/c++调试环境搭建】

​​​​​​码哥讲源码-原理源码篇【揭秘join方法的唤醒本质上决定于jvm的底层析构函数】

码哥源码-原理源码篇【Doug Lea为什么要将成员变量赋值给局部变量后再操作?】

码哥讲源码【你水不是你的错,但是你胡说八道就是你不对了!】

码哥讲源码【谁再说Spring不支持多线程事务,你给我抽他!】

终结B站没人能讲清楚红黑树的历史,不服等你来踢馆!

打脸系列【020-3小时讲解MESI协议和volatile之间的关系,那些将x86下的验证结果当作最终结果的水货们请闭嘴】

1 介绍

上一期我们介绍了 Redis系列19:LRU淘汰内存淘汰算法分析 ,大致了解了LRU(Least Rencently Used) 的算法原理,即将最近最久未使用的算法进行数据淘汰。
但是这样的算法也有一些比较明显缺陷:

  • 稳定性和性能问题:LRU算法认为最近最少使用的数据是最该被淘汰的,但是这可能导致某些数据被频繁地淘汰和加载,因为它们可能只在某个时间段内被使用一次,而在其他时间段内则不会被使用。这会使得缓存的效率降低,增加了CPU和内存之间的通信开销。
  • 空间问题:LRU算法需要维护一个链表来记录数据的访问顺序,这需要额外的空间。链表可能会占用较大的空间,导致缓存的效率降低。
  • 访问顺序问题:我们的访问顺序并不一定是按照时间来的,而是有一定的规律。例如,我们在处理数据时可能会按照某个频率访问数据,而不是按照时间顺序。这种情况下,LRU算法可能会将某些我们还需要被访问数据淘汰掉。
  • 数据局限性问题:淘汰算法的本意是保留那些将来最有可能被再次访问的数据,而LRU算法只是预测最近被访问的数据将来最有可能被访问到。这样太局限,误伤很多高频被访问但某段时间空窗的数据。

如上图,Key 1会被优先淘汰掉,但实际上,Key 1的访问频率和可能行高很多,我们并不希望Key 1被淘汰,而是希望淘汰率是 Key 2 > Key 1
为了解决这些问题,一些改进的算法被提出来,例如LFU(Least Frequently Used)算法和FIFO(First In First Out)算法。这些算法在某些情况下比LRU算法更合理更有效。

2 实现原理

LFU(Least Frequently Used)是Redis 4.0 引入的淘汰算法,它通过key的访问频率、访问时间比较来淘汰key,重点突出的是Frequently Used,用于在缓存容量有限时决定哪些缓存块应该被清除。

LFU算法根据缓存块的使用频率来决定哪些块应该被清除。具体来说,它会记录每个缓存块的使用次数,并按照使用次数从低到高排序。当缓存达到容量上限时,LFU算法会选择使用次数最少的缓存块进行清除,也就是最不经常使用的缓存块。

LFU算法的优点是能够有效地防止缓存溢出,并且能够最大限度地减少清除重要数据的概率。但是,由于需要记录每个缓存块的使用次数,因此LFU算法需要较大的内存空间,并且由于需要经常更新使用次数,因此其时间复杂度相对较高。

LFU算法常用于Web缓存、数据库缓存、文件系统缓存等场景,用于提高系统的性能和稳定性。

实现原理如下:

LFU近似于LRU,使用概率计数器Morris计数器来估计每个对象的访问频率,并结合衰变周期使计数器随时间减少。这样,即使在过去,我们也不再考虑频繁访问的密钥。因此,该算法可以适应访问模式的变化。
Redis4.0之后 maxmemory_policy 淘汰策略 添加了两个LFU模式:

  • allkeys-lfu:对全部key采用LFU淘汰算法进行计算
  • volatile-lfu:对设置了过期时间的key采用LFU淘汰算法

3 算法实现

3.1 从源码理解算法实现过程

在LFU模式下,Redis对象头的24bit lru字段被分成两段来存储。其中,高16bit用于存储最后一次计数器降低的时间(ldt),低8bit用于存储访问次数的对数值(logc)。

  • 高16bit的ldt字段用于记录最近一次计数器降低的时间。由于只有16bit,它可以表示的最大值为65535(2^16-1)。由于时间以1秒为单位进行计数,因此大约每45.5天(65535/24/60)时间戳会折返重新从0开始。
  • 低8bit的logc字段用于记录访问次数的对数值。由于只有8bit,它可以表示的最大值为255。实际上,logc无法记录真实的Redis key的访问次数,因为每个新加入的key的logc初始值为5(LFU_INITI_VAL),这样可以保证新加入的值不会被首先选中淘汰。每次访问key时,logc都会更新。
         16 bits      8 bits
    +----------------+--------+
    + Last decr time | LOG_C  |
    +----------------+--------+

  • Last Decrement Time计算的算法源码:
    /* Return the current time in minutes, just taking the least significant
     * 16 bits. The returned time is suitable to be stored as LDT (last decrement
     * time) for the LFU implementation. */
    // server.unixtime为Redis缓存的Unix时间戳
    // 使用的Unix的分钟时间戳,取模2^16
    unsigned long LFUGetTimeInMinutes(void) {
      return (server.unixtime/60) & 65535;
    }
     
    /* Given an object last access time, compute the minimum number of minutes
     * that elapsed since the last access. Handle overflow (ldt greater than
     * the current 16 bits minutes time) considering the time as wrapping
     * exactly once. */
    unsigned long LFUTimeElapsed(unsigned long ldt) {
      // 获取系统当前的LFU time
      unsigned long now = LFUGetTimeInMinutes();
      // 如果now >= ldt 直接取差值  
      if (now >= ldt) return now-ldt;
      // 如果now < ldt 增加上65535
      return 65535-ldt+now;
    }
  • Redis Logistic Counter增长计算的源码:
    /* Logarithmically increment a counter. The greater is the current counter value
     * the less likely is that it gets really implemented. Saturate it at 255. */
    uint8_t LFULogIncr(uint8_t counter) {
      // Logistic Counter最大值为255 (8位的最大值),  如果已经是最大值了,直接返回
      if (counter == 255) return 255;
      // 取一个0~1之间的随机数数
      double r = (double)rand()/RAND_MAX;
      // counter减去LFU_INIT_VAL (LFU_INIT_VAL为每个key的Logistic Counter基数值,默认为5)
      double baseval = counter - LFU_INIT_VAL;
      // 如果衰减之后counter已经小于基数(如5),那么得出的结果 < 0,也取0
      if (baseval < 0) baseval = 0;
      // 可以看出如果lfu_log_factor的值越大,分母越大,得到的p越小
      double p = 1.0/(baseval*server.lfu_log_factor+1);
        // p 越小,r < p的可能性就越小,Logistic Counter增加的概率就越小
    	// 综上,lfu_log_factor越大增长越缓慢,缓解255空间紧张的问题
      if (r < p) counter++;
      return counter;
    }

3.2 在redis.conf中开启配置

可以修改redis.conf配置文件,设置maxmemory-policy volatile-lfu / allkeys-lfu 来进行开启

    # MAXMEMORY POLICY: how Redis will select what to remove when maxmemory
    # is reached. You can select one from the following behaviors:
    #
    # volatile-lru -> Evict using approximated LRU, only keys with an expire set.
    # allkeys-lru -> Evict any key using approximated LRU.
    # volatile-lfu -> Evict using approximated LFU, only keys with an expire set.
    # allkeys-lfu -> Evict any key using approximated LFU.
    # volatile-random -> Remove a random key having an expire set.
    # allkeys-random -> Remove a random key, any key.
    # volatile-ttl -> Remove the key with the nearest expire time (minor TTL)
    # noeviction -> Don't evict anything, just return an error on write operations.
    #
    # LRU means Least Recently Used
    # LFU means Least Frequently Used
    #
    # Both LRU, LFU and volatile-ttl are implemented using approximated
    # randomized algorithms.
    #
    # Note: with any of the above policies, when there are no suitable keys for
    # eviction, Redis will return an error on write operations that require
    # more memory. These are usually commands that create new keys, add data or
    # modify existing keys. A few examples are: SET, INCR, HSET, LPUSH, SUNIONSTORE,
    # SORT (due to the STORE argument), and EXEC (if the transaction includes any
    # command that requires memory).
    #
    # The default is:
    #
    # maxmemory-policy noeviction
    #
    #
    # 备注1:对设置了过期时间的key启用LFU淘汰算法
    # maxmemory-policy volatile-lfu
    # 备注2:对全部key启用LFU淘汰算法进行计算
    # maxmemory-policy allkeys-lfu

4 总结

LFU(Least Frequently Used)是Redis 4.0 引入的淘汰算法,它通过key的访问频率、访问时间比较来淘汰key,重点突出的是Frequently Used,用于在缓存容量有限时决定哪些缓存块应该被清除。它避免了LRU淘汰算法明显缺陷。

  • 11
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值