ElasticSearch底层原理总结

https://blog.csdn.net/njpjsoftdev/article/details/54015485
个人基于上文链接进行一个个人的重点总结,供大家参考。

一、Lucene

  1. 1、索引构成:

前缀和后缀 + 倒排表 ,形成有向无环图

  1. 2、索引结构:FST(最小有向无环图)

eg:北京 北京天安门 ——》 北京2天安门 (相同前缀,只记offset偏移量,减少空间)

  1. 3、倒排索引解释:

文章包含词,是正排。
词到文章是倒排。

  1. 4、倒排表结构:

特点:数据压缩、跳跃表加速合并

  1. 5、Lucene列式存储DocValues(ES的聚合原理)

二、ES查询原理

**普通匹配查询:**排索引能够解决从词到文档的快速映射, 倒排索引

**ES的聚合查询:**分类、排序、数学计算等聚合操作时需要文档号到值的快速映射,Lucene列式存储DocValues

eg:

select gender,count(*),avg(age) from employee where dept='sales' group by gender
ES基于倒排索引和DocValues实现上述SQL的。

在这里插入图片描述
  1. 从倒排索引中找出销售部门的倒排表。
  2. 根据倒排表去性别的DocValues里取出每个人对应的性别,并分组到Female和Male里。
  3. 根据分组情况和年龄DocValues,计算各分组人数和平均年龄
  4. 因为ElasticSearch是分区的,所以对每个分区的返回结果进行合并就是最终的结果。

**注意:**因为单点内存聚合,所以每个分区不可能返回所有分组统计信息,只能返回部分,汇总时就会导致最终结果不正确

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值