elasticsearch部分调优策略

最新推荐文章于 2023-08-04 15:52:46 发布

Chris_Chris_

最新推荐文章于 2023-08-04 15:52:46 发布

阅读量111

点赞数

分类专栏：搜索引擎 # elasticsearch 文章标签： elasticsearch 搜索引擎

本文链接：https://blog.csdn.net/weixin_41029286/article/details/116852913

版权

搜索引擎同时被 2 个专栏收录

18 篇文章 0 订阅

订阅专栏

elasticsearch

18 篇文章 1 订阅

订阅专栏

写入调优

集群首次灌入数据的时候，可以把副本的参数设置成0个，等灌入完毕了以后再调回配置的副本数，这样副本的分片只需要拷贝，节省索引过程
让es自动生成doc id。写入doc的时候如果指定了id，es会先查询判断是否需要更新，这里会读取磁盘，如果自动生成id的话就没有这个操作。
不需要建立索引的字段的index属性设置为not_analyzed或者no（不分词或者不建立索引）。这样可以降低cpu占用，尤其是binary类型，默认情况下占用CPU非常高，而这种类型进行分词通常没有什么意义。
减少内容的长度
使用不同的分词器，如果一个字段只有英文，那么可以只使用英文的分词器，英文的分词器效率是要优于中文的
对analyzed的字段禁用norms，norms用于搜索时计算评分

PUT /worker_index
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text",
        "analyzer": "ik_max_word"
      },
      "job": {
        "type": "text",
        "analyzer": "ik_max_word",
        "norms": false
      }
    }
  }
}

在这里插入图片描述

调整segment刷新间隔(默认1秒)，减少刷新segment消耗的系统资源

PUT /worker_index/_settings
{
  "index": {
    "refresh_interval": "30s"
  }
}

在这里插入图片描述

使用bluk批处理请求，并且每批处理尽量路由到较少的分片上

查询优化

source字段中保存了的文档的原始数据

source中不需要查询的字段可以通过includes excludes过滤
搜索时候使用Query，需要为Document的相关度打分。使用Filter，没有打分环节处理，理论上filter更快一些
如果ID字段不会被用作Range 类型搜索字段，都可以定义成keyword类型。这是因为 keyword会被优化，以便进行terms查询。Integers等数字类的mapping类型，会被优化来进行range类型搜索。
限制查询条件

Chris_Chris_

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
elasticsearch部分调优策略

写入调优集群首次灌入数据的时候，可以把副本的参数设置成0个，等灌入完毕了以后再调回配置的副本数，这样副本的分片只需要拷贝，节省索引过程让es自动生成doc id。写入doc的时候如果指定了id，es会先查询判断是否需要更新，这里会读取磁盘，如果自动生成id的话就没有这个操作。不需要建立索引的字段的index属性设置为not_analyzed或者no（不分词或者不建立索引）。这样可以降低cpu占用，尤其是binary类型，默认情况下占用CPU非常高，而这种类型进行分词通常没有什么意义。减少内容的长
复制链接

扫一扫

专栏目录