(九)elasticsearch之分组去重(collapse)

本文探讨了如何在Elasticsearch中实现检索结果的去重统计计数和去重显示。针对问题一,利用cardinality进行聚合计数;问题二,提供了两种解决方案,包括字段聚合与top_hots聚合,以及更简洁高效的collapse折叠功能。文中通过DSL实例展示了collapse的使用,并强调其性能优势及注意事项,如不兼容scroll、rescore等特性,且折叠字段需为keyword类型。
摘要由CSDN通过智能技术生成

一、背景介绍

问题一:如何对elasticsearch的检索结果进行去重统计计数。类似mysql 的 select count(*) from a group by b。

问题二:如何对elasticsearch的检索结果去重后显示。类似mysql 的select distint(“name”) from a group by b。

二、分析

问题一:

​ 统计计数需要借助elasticsearch聚合功能结合cardinality实现。

问题二:

​ 方式一:使用字段聚合+top_hots聚合方式。

​ 方式二:使用collapse折叠功能。

三、DSL 实例

问题一:

// 统计去重数目
GET user/_search
{
   
    "size":0,
    "aggs" : {
   
        "name_count" : {
   
            "cardinality" : {
   
            	"field" : "name"
            }
        }
    }
}

问题二:

方式一:top_hits 聚合

GET user/_search
{
   
    "query": {
   
        "match_all": {
   
            
        }
    },
    "aggs": {
   
        "type": {
   
            "terms": {
   
                "field": "name",
                "size"
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值