elasticsearch mapping之store

最新推荐文章于 2023-11-13 09:30:38 发布

vincent_hahaha

最新推荐文章于 2023-11-13 09:30:38 发布

阅读量400

点赞数

分类专栏： elasticsearch

本文链接：https://blog.csdn.net/vincent_duan/article/details/103959830

版权

elasticsearch 专栏收录该内容

53 篇文章 23 订阅

订阅专栏

_source字段存储的是索引的原始内容，那store属性的设置是为何呢？es为什么要把store的默认取值设置为no？设置为yes是否是重复的存储呢？

默认情况下，字段的值是可以被索引到的(即：index:true)，但是没有被存储(即：store: false)，而这就意味着该字段可以search到，但是原始字段的值确无法被检索。
因为字段的值已经在_source中有一份了，这是默认存储的。如果文档的某一字段设置了 store 为 yes (默认为 no)，这时候会在 _source 存储之外再为这个字段独立进行存储，这么做的目的主要是针对内容比较多的字段，放到 _source 返回的话，因为_source 是把所有字段保存为一份文档，命中后读取只需要一次 IO，包含内容特别多的字段会很占带宽影响性能，通常我们也不需要完整的内容返回(可能只关心摘要)，这时候就没必要放到 _source 里一起返回了(当然也可以在查询时指定返回字段)。
对内容太长的字段，将 store 设置为 yes ，一般来说还应该在 _source 排除 exclude 掉这个字段，这时候索引的字段，不会保存在 _source 里了，会独立存储一份，查询时 _source 里也没有这个字段了，但是还是可以通过指定返回字段来获取，但是会有额外的 IO 开销，因为 _source 的读取只有一次 IO ，而已经 exclude 并设置 store 的字段，是独立存储的需要一个新的 IO 。
例如，如果您的文档包含a title，a date和非常大的content 字段，您可能只想检索title和date，而不是从更大的_source字段中抽取想要的字段：

PUT my_index
{
  "mappings": {
    "properties": {
      "title": {
        "type": "text",
        "store": true 
      },
      "date": {
        "type": "date",
        "store": true 
      },
      "content": {
        "type": "text"
      }
    }
  }
}

PUT my_index/_doc/1
{
  "title":   "Some short title",
  "date":    "2015-01-01",
  "content": "A very long content field..."
}

GET my_index/_search
{
  "query": {
    "bool": {
      "filter": {
        "match": {
          "title": "Some"
        }
      }
    }
  },
  "stored_fields": [ "title", "date" ] 
}