fst和skiplist

前言

1:为什么要讲fst和skiplist

检索的倒排结构通常包含两种结构,一个是词典(一般要加载到内存),一个是倒排表。如下图

 

一次查询需要经历两个阶段,找到词典的位置(或者叫判断这个词存不存在),比如输入Lucene,先要找到这个词存在的位置。词典的存储结构就有两种实现方式,fst或跳表。Lucene3.0之前使用的是跳跃表结构,后换成了FST,但跳跃表在Lucene其他地方还有应用如倒排表合并和文档号索引。@hxx  跳跃表加速合并,因为布尔查询时,and 和or 操作都需要合并倒排表,这时就需要快速定位相同文档号,所以利用跳跃表来进行相同文档号查找

2:两者在Lucene中各占据什么位置?关系是怎样的

都是或者曾经是词典数据结果的实现方式,现在各自在Lucene中占据一席之地。没有啥关系,看优缺点吧!

skiplist优点:结构简单、跳跃间隔、级数可控,Lucene3.0之前使用的也是跳跃表结构,后换成了FST,但跳跃表在Lucene其他地方还有应用如倒排表合并和文档号索引。 skiplist 缺点:模糊查询支持不好

skiplist优点:内存占用率低,压缩率一般在3倍~2

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

huangleijay

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值