ElasticSearch-倒排索引

最新推荐文章于 2024-07-12 15:43:18 发布

宁愿一生都不说话

最新推荐文章于 2024-07-12 15:43:18 发布

阅读量1.1k

点赞数

分类专栏： ElasticSearch 文章标签： elasticsearch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50369190/article/details/128498428

版权

ElasticSearch 专栏收录该内容

5 篇文章 1 订阅

订阅专栏

文章目录

一、mysql数据库存在的问题
- 1.1 模糊查询索引失效
- 1.2 不能分词查询
二、倒排索引

一、mysql数据库存在的问题

在这里插入图片描述

1.1 模糊查询索引失效

假设要查询上图中title中包含"手机"的信息，那么sql语句是这样的

SELECT * FROM goods WHERE title LIKE '%手机%';

如果使用模糊查询，左边有通配符，不会走索引，会全表扫描，性能低

1.2 不能分词查询

假设上表查询title检索内容为"我要买一部华为手机",无论sql语句怎么模糊匹配都只会查询到包含这整条句子的title，显然数据库中是不存在的。
关系型数据库提供的查询，功能太弱
所以需要用到ES的倒排索引，以关键词为索引库，而关键词又是对原有数据内容拆分出来的，比如"我要买一部华为手机"中华为和手机关键词拆分出来作为索引查询就会灵活很多。

二、倒排索引

就像使用新华字典查找汉字，先找到汉字的偏旁部首，再根据偏旁部首对应的目录（索引）找到目标汉字。

正排索引：是以文档对象的唯一 ID 作为索引，以文档内容作为记录的结构。
倒排索引：Inverted index，指的是将文档内容中的单词作为索引，将包含该词的文档 ID 作为记录的结构。

ES倒排索引样例：

假设文档0(编号0)： we like java java java
假设文档1(编号1)： we like lucene lucene lucene

建立倒排索引的流程
1.首先对所有数据的内容进行拆分（分词），拆分成唯一的一个个词语（词条Term）。
2.然后建立词条和每条数据的对应关系（词条在文档出现的位置下标，出现频率）

（Term 词条）	(Doc ID，Freq 频率)	（Pos 位置）
we	(0,1) (1,1)	(0,0)(1,0)
like	(0,1) (1,1)	(0,1)(1,1)
java	(0,3)	(2,3,4)
lucene	(1,3)	(2,3,4)

假设文档2(编号1)：java java java we like

（Term 词条）	(Doc ID，Freq 频率)	（Pos 位置）
we	(0,1) (1,1)	(0,0)(1,3)
like	(0,1) (1,1)	(0,1)(1,4)
java	(0,3) (1,3)	(0,2,3,4) (1,0,1,2)
lucene	(1,3)	(2,3,4)

假设只有1个文档有，Pos位置第一位就不需要标识是几号文档，假设是有多个文档有，Pos位置的第一位默认就是文档编号

倒排索引：将每条数据中的内容进行分词，形成词条。然后记录词条和数据的唯一标识（id）的对应关系，形成的产物。

宁愿一生都不说话

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ElasticSearch-倒排索引

为什么要使用倒排索引，ES中的倒排索引又是什么。
复制链接

扫一扫

专栏目录

宁愿一生都不说话 CSDN认证博客专家 CSDN认证企业博客

码龄4年

54: 原创

75万+: 周排名

75万+: 总排名

5万+: 访问

: 等级

577: 积分

12: 粉丝

27: 获赞

12: 评论

180: 收藏

私信

关注

热门文章

分类专栏

java 30篇
SpringCloud 2篇
ElasticSearch 5篇
nacos 1篇
mybatis_plus 1篇
git 5篇
spring 2篇
Jsp 1篇
tomcat 2篇
mysql 1篇
xml 1篇
hexo 1篇
数据结构 2篇

最新评论

mac-m1通过brew安装elasticsearch
苍月惊羽: 2024-03-17，此种方式的安装已经无法正常安装，报错jdk.app已经损坏或不完整，macOS不是14.4 也不行
IDEA中Git回溯版本push被拒问题
sunsunaixuxu: 亲测,可用
java基础-注解定义和解析
GCM_邮个拥抱: 描述很易懂, 而且案例也很简单直接
java实现简单的验证码
宁愿一生都不说话: 已经更改，感谢哥
java实现简单的验证码
宁愿一生都不说话: 是的，没注意，已经更改，感谢哥

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。