第二章：ElasticSerch 基本概念

最新推荐文章于 2024-09-06 17:28:20 发布

五斗米折腰

最新推荐文章于 2024-09-06 17:28:20 发布

阅读量833

点赞数

分类专栏： elasticsearch专题文章标签：华为

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_17342753/article/details/121187026

版权

ElasticSearch是一个高性能的搜索引擎，采用倒排索引来解决关系型数据库的性能低和功能弱的问题。它创建索引库（相当于数据库）、文档（相当于数据行），并以JSON格式存储数据。倒排索引使得模糊查询和多词搜索变得高效。ElasticSearch还支持分布式、高扩展和实时搜索与数据分析，常用于海量数据搜索、日志分析和数据实时分析。与MySQL对比，ElasticSearch缺少事务，但提供更强大的搜索功能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

es
是一种搜索引擎软件

搜索就是查询

和关系型数据库对比
如goods 商品表
id title sell_point
1001 华为p30手机黑色 4.5英寸

select * from goods where title like "%华为%"
1、假如我们给 title 加上索引但是like 左边加上通配符后索引会失效。意味着全表扫描如果有一亿个商品那么效率很低。

模糊查询可能造成全表扫描

2、select * from goods where title like "%华为手机%" 这样是查询不出来的，必须要华为和手机分开查。
但是es就能实现。
关系型数据库功能弱。

那么es是如何解决刚才的两个问题的：性能低功能弱。

1、倒排索引：就是将文本内容进行分词形成词条然后记录词条和数据的唯一标识的对应关系。
首先将一段文本按照一定的规则拆分成不同的词条term。
如：床前明月光拆分为：床前明月光

反向倒排索引
key (词条term)=>value(存储内容)
床=》床前明月光
前=》床前明月光
床前=》床前明月光
明=》床前明月光
月=》床前明月光
明月=》床前明月光
光=》床前明月光
月光=》床前明月光

上面的value(存储内容)数据量很大其实只需要放 id就行了

es 存储数据和搜索原理：

索引库：index 它其实就相当于关系型数据库中的数据库。
数据叫做文档：document 他就相当于我们关系型数据库中的表里面的一行一行的数据。

在es中文档的数据结构其实就是json的数据格式

如：{
“id”:"1",
"title":"华为p30手机"，
“price”：3980.00
}
{
“id”:"2",
"title":"三星GNX手机"，
“price”：3980.00
}
{
“id”:"3",
"title":"红米4g手机"，
“price”：3980.00
}

如果我们需要对 title 进行分词：具体分词规则是什么是由es来完成的。

形成的倒排索引如下：
key value
华为 1
p30 1
手机 1，2，3
手 1，2，3
机 1，2，3
三星 2
GNX 2
红米 3
4g 3

index 索引库存储了文档和文档分词后的倒排索引库。

es 搜索：

它是通过倒排索引来搜索

如：我们要搜索“手机"这个词
第一步 es会拿着这个 “手机这个词” 去倒排索引中去匹配。

匹配到了就会根据对应的id去把文档找到返回给用户

假设：词条数据量很大恰好要查询的词条再最后面怎样处理？查询数据岂不是依然很慢。

es帮我们解决了那就是对词条进行排序形成一个树形的数据结构（请自行补数据结构算法知识），这样提升词条的速度。

1、这样关系型数据中的查询性能低的问题 es给我们解决了。

2、假如要查询 "华为手机" 这样一个词条呢这样没有词条匹配岂不是查询不出来吗？

es的解决方案是先分词再查询࿱

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。