实时索引

本文介绍了一种高效的文档更新索引策略,通过记录修改次数和使用大小ID编号方法来标记索引的有效性,确保搜索结果的准确性。这种方法允许在不删除旧索引的情况下添加新索引,减少了对旧数据的操作,提高了系统的性能。
摘要由CSDN通过智能技术生成
  1. 记录修改次数
    • 一个全局的位图结构记录每个文档的当前修改次数,每次修改该次数增1。这样只需要对修改后内容的term的索引拉链进行追加,并在索引中记录当前修改次数,原来的term不需要动。检索的时候在获取索引拉链时比较修改索引中记录的修改次数是否与全局结构的修改次数相同,不同则是“过期”的索引,不再使用。这些过期的索引可以在合并的索引库的时候丢弃。
  2. 大小ID编号方法
    • ID表示全局ID,大ID表。每次文档修改时,都会为文档重编一个大ID(小ID不变),并且将该文档修改之前对应的大ID在位图中置为无效,并且和修改次数方法一样,只追加到新term,旧term不动。检索时,读取term的索引,在全局位图中判断是否有效。过期的索引也可以在合并索引库时丢弃。注意:这里小ID并没有起什么作用,它只是和外部系统的一个接口,放到DI中即可。示检索系统内部ID。一个全局的位图结构记录大ID当前是否有效
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值