ES如何通过文档id获取正排信息

前言

根据文档id定位到某个字段的正排信息,常常用于需要根据某个字段排序,分类计算,这个必须使用Doc values

 

正文

1: 在ES中原始数据是以行式存储的,也就是文档的所有字段都会连续的存储在物理空间上。

这样势必会占用非常多的空间,所以一般都是压缩存储的!

正排信息不是来自于原始文档中。存储原始文档的文件 如下

 

查看原始文档的过程!

第一步二分查找block,定位属于哪个block。 

  第二步就是根据从block里根据每个chunk的起始文档号,找到属于哪个chunk和chunk位置。 

  第三步就是去加载fdt的chunk,找到文档。

2: docvalues结构 @hxx 列式存储

在建倒排的时候,docvalues就会同时建好

正排的结构如下:

因为是列式存储,就是说所有文档的city会连续存储!其中city会用一些压缩技术,比如漂移量或者公约数来减少空间。

上面的结构列子,是city字段,如果是string的话,又不一样,在ES中叫做analyze string࿰

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

huangleijay

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值