搜索引擎缓存机制

缓存(Cache)是目前所有搜索引擎都会采用的技术。

缓存——就是在高速内存硬件设备内开辟一块数据存储区,用来容纳常见的用户查询以及搜索结果(或索引数据以及搜索的中间结果),同时采用一定的管理策略来维护存储区内的数据。

缓存的目的:加快用户查询的响应速度;减少搜索引擎后来计算量,节省计算资源;

缓存系统架构

 

缓存淘汰策略:根据一定的策略将缓存中的项目进行替换,因为不论给缓存多大的空间,当系统运行到一定的程度,很可能缓存已经满了,当有新的需要缓存的内容要进入缓存时,需要根据一定的策略,从缓存中剔除一部分优先级别较低的缓存内容,以腾出空间供后续内容放入缓存存储区;

SRLU策略——将缓冲区分为:非保护区域和保护区域,每个区域按使用频率由高到底进行排序,频率高端的将MRU,低端叫LRU,如果内容没有在缓存中,那么将这个查询放入非保护区域的MRU,如果某个查询命中非保护区域,则把这个查询记录放到保护区域的MRU端,如果此时保护区域已满,则把保护区LRU端数据放到非保护区的MRU,这样保护区域的记录最少呗访问两次;淘汰机制是将非保护区的LRU端缓存项淘汰

 

缓存更新策略:根据一定的策略保证缓存中的内容与索引内容一致,如果搜索引擎索引的文档集合是静态文档,文档集合不会发生任何变化,则缓存不存在更新问题,只有当搜索引擎处理的文档集合是动态变化的,索引已经反映了文档集合的变化,而缓存数据并没有随索引作出相应的变化,就发生了缓存内容与索引内容不一致的问题;

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值