为啥ElasticSearch搜索那么快？倒排索引又是啥？

最新推荐文章于 2023-02-09 00:14:33 发布

沙滩de流沙

最新推荐文章于 2023-02-09 00:14:33 发布

阅读量652

点赞数 1

分类专栏：数据结构文章标签： elasticsearch

本文链接：https://blog.csdn.net/weixin_41231928/article/details/111657805

版权

数据结构专栏收录该内容

13 篇文章 3 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

在搜索引擎中包含很多的文件，每个文件都有对应的ID，文件内容就是系列关键词的集合（每个关键词也有对应ID）。

例如“文档1”经过分词，提取了100个关键词，会记录每个关键词在文档中的出现次数和出现位置。

一、倒排索引

假如给你一个文本库，现在让你去找出所有包含“Hello”这个单词的文档，并按该单词出现的频率高低进行权重，即出现次数最多的文本优先展示。

1.1 正排索引

倒排索引是相对于正排索引来说的，对于上面的场景，先看正排索引会怎么做：

如果是正排索引，结构如下：

可以看到正排索引是以文档为第一层，也就是说如果要搜索包含关键词1的文档，那么所有文档都需要扫描，记录哪些文档包含了关键词1，最后返回结果。

1.2 倒排索引

上面介绍了正派索引，可以看到在根据某个关键词进行搜索时需要扫描所有文档，这个效率就太低了，要是文档少还好，要是海量文档，肯定影响用户体验。

于是就出现了倒排索引来解决上面的问题，倒排索引结构如下：

了解本专栏

超级会员免费看

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
为啥ElasticSearch搜索那么快？倒排索引又是啥？

一、倒排索引假如给你一个文本库，现在让你去找出所有包含“Hello”这个单词的文档，并按该单词出现的频率高低进行权重，即出现次数最多的文本优先展示。1.1正排索引倒排索引是相对于正排索引来说的，对于上面的场景，先看正排索引会怎么做：如果是正排索引，...
复制链接

扫一扫

专栏目录

沙滩de流沙 CSDN认证博客专家 CSDN认证企业博客

码龄6年

213: 原创

3万+: 周排名

25万+: 总排名

61万+: 访问

: 等级

5589: 积分

338: 粉丝

395: 获赞

139: 评论

1597: 收藏

私信

关注

分类专栏

最新评论

git 撤回操作(1.IDEA中，撤回已经commit未push的 2.撤回已经push的)
CSDN-Ada助手: Intellij IDEA 自带的版本控制系统是什么，它有什么优缺点？
VMware搭建Hadoop集群 for Windows（完整详细，实测可用）
dengpeng_csdn: 只修改节点2的vim hdfs-site.xml后（节点1 和节点3没配置），启动start-dfs.sh后，三个节点都成了secondery namenode 怎么处理？配置1、3节点分为为namenode和datanode？怎么配置？
数据库表设计-------三个范式
CSDN-Ada助手: Apache Arrow 这种列式内存格式，它的优势是什么？
VMware搭建Hadoop集群 for Windows（完整详细，实测可用）
普通网友: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
VMware搭建Hadoop集群 for Windows（完整详细，实测可用）
sunana67: 配置DNS、网关这里，要分别设置IPADDR：221、222、223。要是都是221，后边免密登录会失败。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

沙滩de流沙 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。