文件访问预测

注:“文件访问预测”是我论文的研究工作中的一部分。
 
   处理器与I/O存在速度鸿沟、网络带宽的限制(特别是无线移动网络)、网络应用的断连操作(如移动计算、AFS)等原因,造成了数据访问的延迟,IO和网络成为了制约性能的瓶颈。

  为了解决这个问题,通常采用缓存(Cache)和预取(Pre-fetch)技术。缓存技术利用数据访问的时间局部性,对访问过的数据进行暂时的保留。但由于缓存空间大小以及更新算法的制约,当数据频繁更新时,缓存带来的性能改善不再显著。预取(Pre- fetch)是主动缓存技术,利用数据访问的空间局部性,对将来可能发生的数据请求进行预测,在访问之前取出并Cache,以备用户访问,从而减少访问延迟。

  预取可以提高系统的性能,但是也存一些不足:
 (1)影响正常的数据访问负载
 (2)错误的预取会降低整个系统性能
 (3)很难做到精确地预测并在需要时完成预取

  预取的基础是预测,它解决预取什么的问题。为什么预测是有效的呢?一方面,数据请求并非完全随机,由用户或程序行为驱动的。另一方面,许多数据之间存在内在的关联。预测的关键是挖掘数据访问行为模式,构建数据之间的关联。

  预取的基本思想是:通过对数据本体或历史访问记录的分析,构造合适的预测模型,对未来的访问模式进行预测,在访问之前取出并缓存,以备用户访问,减少访问延迟。

  预取的两种方法:
 (1)基于预测的预取(显式):精确的预测模型,尽量减少错误预测,平滑预取。
 (2)基于分组的预取(隐式):构建稳定数据分组,适用于比较稳定的访问模式。

  预测涉及的相关理论包括统计分析、机器学习、人工智能、数据库等。

 (刘爱贵 / Aiguille.Liu)
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值