主要参考文章:http://www.tuicool.com/articles/B3QnQzE
正排索引与倒排索引
Elasticsearch使用一种叫做倒排索引(inverted index)的结构来做快速的全文搜索。倒排索引由在文档中出现的唯一的单词列表,以及对于每个单词在文档中的位置组成。倒排索引的结构如下图,它存储的内容是“
哪些词语出现在了哪些文档中”,这种结构决定了它不能很好的支持对文档的索引、排序、聚合的操作,因此Elasticsearch中增加了field data的数据结构。
Elasticsearch cluster中的内存多半都被消耗在了field data(也就是我们常说的正排索引)上,field data主要用于:
·按照字段排序(sort)
·按照字段进行聚合(Aggregations)