ElasticSearch中的field data（正排索引）

最新推荐文章于 2024-07-01 10:11:57 发布

glrh123

最新推荐文章于 2024-07-01 10:11:57 发布

阅读量4.1k

点赞数

分类专栏： ElasticSearch

本文链接：https://blog.csdn.net/glrh123/article/details/52062762

版权

本文详细介绍了ElasticSearch中的field data，即正排索引，用于字段排序、聚合和过滤。由于其内存消耗大，可能导致频繁GC或内存溢出。文章提到了优化策略，包括过滤field data、预先加载和使用doc values。doc values能将field data存储在磁盘上，降低内存占用，尤其适合numeric、date等字段。

摘要由CSDN通过智能技术生成

 
 主要参考文章：http://www.tuicool.com/articles/B3QnQzE 

 
 正排索引与倒排索引 

  Elasticsearch使用一种叫做倒排索引(inverted index)的结构来做快速的全文搜索。倒排索引由在文档中出现的唯一的单词列表，以及对于每个单词在文档中的位置组成。倒排索引的结构如下图，它存储的内容是“ 
 哪些词语出现在了哪些文档中”，这种结构决定了它不能很好的支持对文档的索引、排序、聚合的操作，因此Elasticsearch中增加了field data的数据结构。 

  Elasticsearch cluster中的内存多半都被消耗在了field data（也就是我们常说的正排索引）上，field data主要用于： 

 
 ·按照字段排序(sort) 

 
 ·按照字段进行聚合(Aggregations) 

最低0.47元/天解锁文章

glrh123

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
ElasticSearch中的field data（正排索引）

主要参考文章：http://www.tuicool.com/articles/B3QnQzE正排索引与倒排索引Elasticsearch使用一种叫做倒排索引(inverted index)的结构来做快速的全文搜索。倒排索引由在文档中出现的唯一的单词列表，以及对于每个单词在文档中的位置组成。倒排索引的结构如下图，它存储的内容是“哪些词语出现在了哪些文档中”，这种结构决定了它不能很
复制链接

扫一扫

专栏目录