Elasticsearch 倒排索引原理

本文介绍了Elasticsearch中的倒排索引原理,相较于传统的正排索引,倒排索引能显著提高搜索效率。倒排索引会根据文档内容进行分词,并建立单词表,记录每个关键字在哪些文档中出现,从而实现快速定位到相关文档,提升搜索性能。
摘要由CSDN通过智能技术生成

看下面这个表格里的文档内容:
在这里插入图片描述
如果我这时候想要在这么多文档中查找带有 比亚迪 的我要怎么查,传统这个查询里面我想查这个比亚迪的话。就是先在文档1里面搜索一下有没有 比亚迪,没有,我在到文档2中查找比亚迪,还是没有,然后到文档3里面查询也是没有比亚迪的,再到文档4里面查还是没有 比亚迪,直到到文档5里面才找到比亚迪的文档信息。

然后再把比亚迪的这个文档5的信息再返回给客户端进行展示起来,这就是传统方式的正排索引,其实他的查询效率特别的低。

接下来说下什么是倒排索引

其实你像很多搜索引擎技术(比如:Solr、Elasticsearch、Lucene)索引用的都是倒排索引,那倒排索引到底是什么意思?

倒排索引会根据你的文档内容把一些关键字做一些分词,相当于用关键字定位到你的文档内容,这是什么意思?

举个例子,还是以这个文档讲一下,这5条文档里面全文检索首先会分析一下,把一些关键字进行整合起来,如下列表所示:
在这里插入图片描述
比如说这个 可能是经常搜到的关键字,还有一家也是比较多的,包括

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值