缓存替换算法笔记 ——2Q

最新推荐文章于 2024-08-16 15:19:46 发布

fei0724

最新推荐文章于 2024-08-16 15:19:46 发布

阅读量3.4k

点赞数 1

分类专栏：算法

算法专栏收录该内容

6 篇文章 0 订阅

订阅专栏

参考资料

2Q: A Low Overhead High Performance Buffer Management Replacement Algorithm

算法描述

2Q: two queue(s) algorithm

应用最广泛的缓存替换算法应该是LRU了，其实现简单有效。但正是因为其简单，对于某些访问场景来说表现并不出色。LRU用新访问页替换冷页，但新换入的页在之后可能再也不会访问到，不仅如此它还会在内存中停留很长时间才会淘汰出去。之后LRU-K算法被提出，跟踪倒数第K次内存页引用的时间，以确保冷页能够尽快淘汰出去。

在O'Neil-Weikum 的论文提出了LRU/2算法，即K=2情况下的LRU-K，相对于LRU的提升在于采用了更加积极一些的置换策略，从而将冷页换出，换出的操作涉及到优先队列的操作。相对于其他缓存替换算法来说，LRU/2 虽然是自适应的，但还是有两个参数需要关注优化。首先是 Correlated Reference Period（关联引用间隔），即缓存在被访问后在内存中停留的时间。在LRU/2中同一进程连续的访问（correlated accesses）可以在buffer中获得该页，但如果是多个进程连续访问这一page的情况，该页并不会获得更高的优先级。第二个参数 Retained Information Period，指在缓存被淘汰后其访问记录还会被保留多久。作者建议设置为200秒，但更高的值也不会有太坏的影响。

2Q与LRU/2对于LRU的改进在某种程度上存在互补性，2Q并不是通过直接将冷页从主缓存中剔出，而是通过将热页换入的形式来实现。与LRU/2算法类似，2Q以该页的第二次被访问时间来计算。简单来说，在某一页第一次被访问的时候，2Q将其放入一个特殊的缓冲区，称为A1 queue，其实现就是一个FIFO队列，如果该页在A1 queue的生存周期内被再次访问，则可能是热页，将其置入Am queue，其实就是一个LRU。如果在A1 queue的生存期内没有再次被访问到，则将其换出。

实现

if p is on the Am queue
then
    put p on the front of Am queue
    /* Am is managed as an LRU queue */
else if p is on the A1 queue
then
    remove p from the A1 queue
    put p on the front of Am queue
else /* first access we know about concerning p */
    /* find a free page slot for p */
    if there are free page slots available
    then
        put p in a free page slot
    else if A1's size is above a (tunable) threshold
        delete from the tail of A1
        put p in the freed page slot
    else
        delete from the tail of Am
        put p in the freed page slot
endif
    put p on the front of the A1 queue
endif

测试后发现这种解决方案对于平均分布的访问请求表现良好,但在实际应用场景中性能不佳。在现实应用中, 访问的区域性变化很大,例如有些页会在短时间内频繁访问,之后很长时间没有访问了。改进后的2Q将 A1 队列分成 A1in 和 A1out。第一次访问会进入 A1in,但之后直接进入 A1out,在 A1out 中被引用的页则进入 Am。

// if there is space, we give it to X
// if there is no space, we free a page slot to
// make room for page X
reclaimfor(page X)
begin
    if there are free page slots then
        put X into a page slot
    else if(|A1in| > Kin)
        page out the tail of A1in; call it Y
        add identifier of Y to the head of A1out
        if (|A1out| > Kout)
            remove identifer of Z from
            the tail of A1out
        endif
        put X into the reclaimed page slot
    else
        page out the tail of Am, call it Y
        // do not put it A1out; it hasn't been
        // accessed for a while
put X into the reclaimed page slot
    endif
end
On accessing a page X:
begin
    if X is in Am then
        move X to the head of Am
    else if (X is in A1out) then
        reclaimfor(X) //这块感觉有点问题，X的空间应该已经在进入A1in的时候准备好了？
        add X to the head of Am
    else if (X is in A1in) // do nothing 
    else //Xisinnoqueue
        reclaimfor(X)
        add X to he head of A1in
    endif
end

理论基础

在 2Q 算法中,A1 队列作为过滤器存在,数据只有在进入 A1out 队列后再次被访问才能进入 Am 队列。假设 miss(与 A0 算法比较后认为是判断失误的部分) 的几率是 m,且 A1out 队列空间为 f。因为 A1out 队列经常是满的 (miss 率远大于 A1out 的命中率)，因此忽略命中的情况下对A1out的影响。这样一来,数据在进入 A1out 队列后经过 f/m 次的访问如果被访问到则会进入 Am 队列,我们将这个概率称作 paccept 。假设对象 i 被访问的几率是 pi,该对象在第 k 次访问后由 A1out 进入 Am 队列的几率是 pi(1−pi)k−1 ,由此得出:

p a c c e p t = \sum k = 1 f / m p i (1 - p i) k - 1 = 1 - (1 - p i) f / m

paccept 的概率随着pi的增大而趋近于1，随着 pi 的减小而趋近与零，因此A1out起到了过滤冷页的作用。我们可以将A1out 过滤器的cutoff hotness定义为访问概率， pcutoff , 在 paccept=1/2 的情况下, paccept 的derivative很大, 被访问概率为 pcutoff 的对象在经过三次而不是两次访问后将被换入Am队列。因此，对于以下方程:

1 - (1 - p i) f / m = 1 / 2

得出其概率。在f和m已知的情况下，我们可以推算出 paccept 的概率为50%的对象的访问率，

p c u t o f f = 1 - (1 / 2) m / f \approx m l n (2) / f

(估算是通过泰勒级数展开，在 m/f≤0.1 的情况下误差小于4%）

从上式中可以看到A1out过滤器能够自调整，当miss率高的时候， pcuttoff 也会相对较高，因此只会将最热的那些对象换入，miss率低时则中度热对象则有足够的几率换入。

接下来，假设p_i和m已知，可以得到在 paccept 的条件下的 f=fcrit :

f c r i t = - m l n (2) / l n (1 - p i) \approx m l n (2) / p i

估算成立的条件是是 ln(1−pi)≈−pi .如果已知Am队列中的访问频率下限，就可以得出f，但是在这里无法预先得知访问概率（否则就直接使用A0算法了）。为了粗略的估算，让我们找出 f=fapprox 的值，可以有%50的概率将平均热度的对象放入Am队列，如果miss率是m且Am的size是B，buffer中一个对象的平均访问概率是 (1−m)/B ，用 fcrit 替换 f ，我们可以得到

f a p p r o x = l n ( 2 ) m B 1 - m

由于以上公式要求预估miss率，实际意义有限。但是它说明了A1out的size与buffer size的比例应该是固定的B。模拟实验表明在m的值在10%到90%之间时，这个比例应该是1/2，对于m更小的系统A1out队列的size也应该更小。

Am的size一般是数据全集的一小部分，设D为数据全集，并且 B=rD ，得出

p c u t o f f = 2 m l n (2) / (r D)

冷数据的平均访问几率是 m/(1−r)D 。假设 X=m/D ，我们可以得出冷数据的平均访问几率是 11−rX ，因此：

p c u t o f f = 2 l n ( 2 ) r X

因为r很小， 2ln(2)r≫11−r ，在 f=B/2 的情况下只要 r 足够小便可以过滤掉冷数据。不仅如此 fapprox/B=1/2 得出 m=1/(1+2ln(2))≈0.419 。只要m不大， fapprox 的值波动不会很大（如果m很大那也没什么办法了），可以得出该算法的性能对于 f 的设置并不敏感， f=B/2 的设置基本上总是不错的。