ElasticSearch底层原理总结

最新推荐文章于 2024-07-30 01:17:14 发布

少年阿峣_从零单排

最新推荐文章于 2024-07-30 01:17:14 发布

阅读量548

点赞数

分类专栏： # ElasticSearch 文章标签： es elasticsearch 原理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_18769269/article/details/89710254

版权

ElasticSearch 专栏收录该内容

15 篇文章 4 订阅

订阅专栏

https://blog.csdn.net/njpjsoftdev/article/details/54015485
个人基于上文链接进行一个个人的重点总结，供大家参考。

一、Lucene

1、索引构成：

前缀和后缀 + 倒排表，形成有向无环图

2、索引结构：FST(最小有向无环图)

eg：北京北京天安门 ——》北京2天安门（相同前缀，只记offset偏移量,减少空间)

3、倒排索引解释：

文章包含词，是正排。
词到文章是倒排。

4、倒排表结构：

特点：数据压缩、跳跃表加速合并

5、Lucene列式存储DocValues(ES的聚合原理)

二、ES查询原理

**普通匹配查询：**排索引能够解决从词到文档的快速映射，倒排索引

**ES的聚合查询：**分类、排序、数学计算等聚合操作时需要文档号到值的快速映射,Lucene列式存储DocValues

eg：

select gender,count(*),avg(age) from employee where dept='sales' group by gender
ES基于倒排索引和DocValues实现上述SQL的。

在这里插入图片描述
　　1. 从倒排索引中找出销售部门的倒排表。
　　2. 根据倒排表去性别的DocValues里取出每个人对应的性别，并分组到Female和Male里。
　　3. 根据分组情况和年龄DocValues，计算各分组人数和平均年龄
　　4. 因为ElasticSearch是分区的，所以对每个分区的返回结果进行合并就是最终的结果。

**注意：**因为单点内存聚合，所以每个分区不可能返回所有分组统计信息，只能返回部分，汇总时就会导致最终结果不正确

少年阿峣_从零单排

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。