ElasticSearch 的倒排索引是什么

倒排索引是一种优化搜索效率的数据结构,通过词典和倒排表记录词与文档的映射,实现快速定位文档。在Lucene等搜索引擎中,FST(Finite State Transducer)作为底层实现,因其空间占用小和查询速度快的特点被广泛应用。倒排索引能将检索时间复杂度降低到O(1),显著提升搜索效率。
摘要由CSDN通过智能技术生成

面试官:想了解你对基础概念的认知。

解答:通俗解释一下就可以。
传统的我们的检索是通过文章,逐个遍历找到对应关键词的位置。

而倒排索引,是通过分词策略,形成了词和文章的映射关系表,这种词典+映射表即为倒排索引。

有了倒排索引,就能实现o(1)时间复杂度的效率检索文章了,极大的提高了检索效率。
在这里插入图片描述

学术的解答方式:
倒排索引,相反于一篇文章包含了哪些词,它从词出发,记载了这个词在哪些文档中出现过,由两部分组成——词典和倒排表。

加分项:倒排索引的底层实现是基于: FST( Finite State Transducer)数据结构。

lucene 从4+版本后开始大量使用的数据结构是FST。FST 有两个优点:
1、空间占用小。通过对词典中单词前缀和后缀的重复利用, 压缩了存储空间;
2、查询速度快。O(len(str))的查询时间复杂度。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值