elasticSearch查询与写入优化

最新推荐文章于 2024-07-22 18:50:40 发布

Wind Drift

最新推荐文章于 2024-07-22 18:50:40 发布

阅读量220

点赞数

文章标签： elasticsearch 搜索引擎 java

本文链接：https://blog.csdn.net/Wind___Drift/article/details/130977935

版权

将文档先保存在index buffer中，以refresh_interval为间隔时间，定期清空buffer,生成segment,借助文档系统缓存的特性
先将segament放在文档系统缓存中，并开放查询，以提升搜索的实时性

Segment没有写入磁盘，即使发生了宕机，重启后数据也能恢复，默认配置是每次请求都会落盘

删除旧的translog文件
生成好的segament写入磁盘/更新commit pointer并写入磁盘,es自动完成，优化点不多

1.增加refresh_interval的数值，默认为1s,改成-1，会禁止自动refresh
避免过于频繁的refresh,生成过多的segment文件，但是会降低搜索的实时性
增大静态配置参数

indices.memory.index_buffer_size(默认是10%，会导致自动触发refresh

降低写磁盘的频率，但是会降低容灾能力

index.translog.durability:默认是request,每个请求都落盘。设置称async,异步写入

index.translog.sync_interval设置为60s,每分钟执行一次（每分钟写一次磁盘）

index.translog.flush_threshod_size:默认为512Mb,可以适当调大，当translog超过该值，会触发flush操作

分片设定
副本在写入时候设置为0，完成后再增加
合理设置主分片数，确保均匀分配在所有数据节点上

index.routing.allocation.total_share_per_node,限定每个索引在每个节点上可分配的主分片数

5个节点的集群，索引有5个主分片，一个副本（5+5)/5=2
生产环境要适当调大这个数字，避免有节点下线时，分片无法正常迁移

一个查询需要查询每个分片，分片过多，会导致不必要的开销,应用场景控制每个分片的大小
Force-merge Read-Only索引
使用基于时间序列的索引，将只读的索引进行force merge ,减少segment数量

关注