elasticsearch聚合查询

本文探讨了Elasticsearch的聚合查询,包括聚合后再过滤超过100万的数据、正则查询、分区聚合、多字段聚合、升级Spring Boot后的调整以及针对text字段聚合的挑战。在实践中遇到的性能问题,如查询速度慢,通过调整查询策略和理解Fielddata限制找到了解决方案。同时,文章提到了text类型字段不支持聚合查询的解决方法,即重建索引。
摘要由CSDN通过智能技术生成

9 聚合后再过滤
查询汇总后多条件过滤超过100万的数据

POST zzp_invoice/_search
{
	"size": 0,
	"query":{
		"range":{
			"SSYF":{
				"gte":"202101",
				"lte":"202112"
			}
		}
	},
	"aggs": {
		"ssyf_group": {
			"terms":{
				"field":"XHDWMC.raw"
			},
			"aggs":{
				"sum_aggs":{
					"sum":{
						"field":"JSHJ"
					}
				},
				"ssyf_group_filter":{
					"bucket_selector":{
						"buckets_path":{"ssyfGroup":"sum_aggs"},
						"script":"params.ssyfGroup>=1000000"
					}
				}
			}
		}
	}	
}

8 正则查询
正则取反,还是使用must_not这个就不用使用?!

GET zzp_invoice/_search
{
    "query":{
        "bool":{
            "must_not":[
                {
                    "regexp":{  
                        "XHDWMC":"(酒店|餐馆|餐饮|饭店)"
                    }
                }
            ]
        }
    }
}

7 分区聚合

GET zzp_invoice/_search
{
	"size":0,
    "aggs":{
        "xhdwmc_term":{
			"terms":{
				"field":"XHDWMC.raw"
			},
			"aggs":{
				"ssyf_range":{
					"range":{
						"field":"SSYF",
						"ranges":[
							{"from":202101,"to":202103},
							{"from":202101,"to":202106},
							{"from":202101,"to":202112},
							{"from":202101,"to":202212}
						],
						"aggs":{
							"sum_ssyf":{
								"sum":{
									"field":"HJJE"
								}
							}
						}
					}
				}
			}
        }
    }
}

6 multi-terms
多字段聚合查询,es7.17之后的版本支持了
Error while creating Elasticsearch API Client(8.0.1) object using Spring Boot

Caused by: java.lang.ClassNotFoundException: jakarta.json.spi.JsonProvider
	at java.net.URLClassLoader.findClass(URLClassLoader.java:382)
	at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
	at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:349)
	at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
	... 73 common frames omitted

解决方案是使用2.0.1版本的jakarta.json-api

 <dependency>
            <groupId>jakarta.json</groupId>
            <artifactId>jakarta.json-api</artifactId>
            <version>2.0.1</version>
        </dependency>
        <dependency>
            <groupId>com.tt</groupId>
            <artifactId>bsfx-iv</artifactId>
            <version>${bsfx.version}</version>
            <exclusions>
                <exclusion>
                    <artifactId>jakarta.json-api</artifactId>
                    <groupId>jakarta.json</groupId>
                </exclusion>
            </exclusions>
        </dependency>

因为spring data elasticsearch的更新速度没有elasticsearch版本的迭代快,故而采用es自身的库,才支持multi_terms

import co.elastic.clients.elasticsearch.ElasticsearchClient;
import co.elastic.clients.elasticsearch._types.aggregations.MultiTermsAggregate;
import co.elastic.clients.elasticsearch.core.SearchRequest;
import co.elastic.clients.elasticsearch.core.SearchResponse;

@Autowired
    private ElasticsearchClient elasticsearchClient;

SearchRequest searchRequest = new SearchRequest.Builder()
                .size(0)
                .index("user_info")
                .aggregations("aggs",agg->agg.multiTerms(multiTerms->
                        multiTerms.terms(term->term.field("WindowsVersion"))
                            .terms(term->term.field("WindowsBits"))
                )).build();
        SearchResponse<UserInfoDto> response = elasticsearchClient.search(searchRequest,UserInfoDto.class);
        MultiTermsAggregate multiTermsAggregate = response.aggregations().get("aggs").multiTerms();
        List<WindowsDto> windowsDtos = new ArrayList<>();
        multiTermsAggregate.buckets().array().stream().forEach(bucket->{
   
            WindowsDto windowsDto = new WindowsDto();
            windowsDto.setCzxt(bucket.key().get(0).stringValue());
            windowsDto.setBits((int)(bucket.key().get(1).longValue()));
            windowsDto.setCn(windowsDto.getBits()==32?-bucket.docCount():bucket.docCount());
            windowsDtos.add(windowsDto);
        }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

warrah

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值