大数据算法课程笔记8a:page replacement algorithm

本文详细介绍了页面替换算法在大数据处理中的应用,特别是clairvoyant算法中的FIF(Furthest in the Future)策略。通过证明FIF算法的最优性,阐述了其如何在预知未来请求序列的情况下达到最小的页面错误次数。同时,讨论了非clairvoyant的在线算法,如LRU,并分析了其性能和竞争比。
摘要由CSDN通过智能技术生成

本节课主要是介绍page replacement algorithm的相关算法,包括offline和online。


1. 问题简介

这个是体系结构里面的经典问题,内存小、硬盘大,内存快、硬盘慢。所以CPU从内存中读取数据,而内存从硬盘中读取数据。那我们希望内存读取硬盘的次数尽量减少,这样可以减少程序的运行时间,而减少次数的算法主要依赖于page replacement algorithm。

所谓page fault,即内存中不存在所需数据而引入的错误,为了解决这个错误就需要从硬盘中读取数据到内存中。所以每个page fault都对应于一次硬盘读取,耗费大量时间。读到的数据需要覆盖内存中的某些现有数据,如何选择被替代的内存中的数据就是page replacement algorithm处理的问题。

(内存和硬盘的关系和cache与内存的关系一样,都是使用类似的思想)

2. Clairvoyant/offline algorithm

算法可以使用未来信息,即可以知道整个请求序列。(这个要求难以在实际中满足)

clairvoyant 算法的最优结果也是所有算法所能满足的最优算法,定义:Given a page arrival sequence z , OPT(z) represents the minimum number of page faults by the best clairvoyant algorithm knowing the sequence z of page arrivals.

2.1. Furthest in the future

FIF算法是一种clairvoyant 算法,并且满足 Cost(FIF,z)=OPT(z) ,即FIF算法的结果是最优的。

算法简介:每次选取最晚被请求的元素进行替换。具体地,设第 i 次请求 ri 造成了一次page fault,对于cache中的每个元素 cj ,定义 fj=argmink{ rk==cjk>i} ,则选择cache中的第 j=argmaxkfk 个元素 cj 进行替换。

例子

request| cache elements| page fault| evicted item|
a -,-,- True -
b a,-,- True -
c a,b,- True -
d a,b,c True c
a a,b,d False
e a,b,d True d
b a,b,e False
a a,b,e False
c a,b,e True a
e c,b,e False
d c,b,e True c
b d,b,e False

2.2. FIF 最优性的证明

参考资料

https://blog.henrypoon.com/blog/2014/02/02/proof-of-the-farthest-in-future-optimal-caching-algorithm/

https://cseweb.ucsd.edu/classes/wi12/cse202-a/lecture4-final.pdf

基本思想:大框架是归纳法,结合分类讨论法。

设FIF的replacement schedule为SFF,而对于任意满足请求序列的schedule S,我们需要证明 #fetches(SFF)#fetches(S) 。所谓schedule,记录了算法的所有操作,例如insert a、evict b,通常一个page fault对应于一对insert和evict。 schedule 的一个子集是reduced schedule,即lazy schedule,只有当request某元素的时候才会insert该元素。一个事实是:对于任意schedule S , 永远存在一个reduced schedule S ,满足 #fetches(S)#fetches(S)

reducedbiji

基于以上的定义以及事实,我们开始证明FIF的最优性。明确目标以及归纳法的假设:

目标 S,#fetches(SFF)#fetches(S) ,即对于所有可以满足request的reduced schedule S ,均满足硬盘读取数不小于 SFF 的读取数。

归纳法的假设 Sj , such that Sj makes the same decisions as SFF for requests from r1 to rj , and #fetches(Sj)#fetches(S) .

Base Case: 令 S0=S , 则有 #fetches(S0)#fetches(S) ,并且 S0=SFF for requests from r1 to r0 (NULL)

假设存在 Sk 满足 Sk makes the same decisions as

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值