描述
某业务集群因业务需要做bool查询,对该查询时间延迟要求需要在500ms一下,在收到应用端反馈查询慢后通过分析集群慢查询日志发现该bool查询平均时间延迟在1~6s左右。
集群环境配置
28个节点(5master + 5协调 +18data),一个物理机部署3~5个节点,物理机内存大小为504GB,每个节点JVM大小为30GB,磁盘空间为2TB,平均使用1.5TB,无存储热点。
慢查询索引配置
54主分片加1倍副本,单个分片大小在50GB左右,分片分布均衡,索引总大小为5TB,search rate为153/s。
索引settings
索引mappings
该索引mapping具有300左右字段,字段类型基本为keyword和double,少数几个为text+keyword。
bool查询语句
慢查询日志
分析
①.在我们初次排查中发现文档响应时间延迟和size单页数据大小成正比关系,但因业务需求不能调整单页数据size值。
②.物理机磁盘读IO平均在 2~3GB/秒 左右(最高离散点能达到8GB)。
综合以上条件,我们目前依然在寻找该慢查询调优的方案,广大热心网友若有良计还望不惜施舍,不胜感激!^ _ ^