Elasticsearch: collapse 去重

最新推荐文章于 2025-04-02 09:10:08 发布

virgil.wang

最新推荐文章于 2025-04-02 09:10:08 发布

阅读量1.9k

点赞数

CC 4.0 BY-SA版权

分类专栏：三. 主流框架详解文章标签： elasticsearch es collapse

本文链接：https://blog.csdn.net/sinat_34351851/article/details/118912680

三. 主流框架详解专栏收录该内容

24 篇文章

订阅专栏

本文介绍了如何在Elasticsearch中使用collapse功能，通过示例展示了在关键词搜索SPU_id时的去重应用。它有助于减少重复结果，但可能影响分页查询和滚动查询。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

官方文档传送门

1、 `collapse`

collapse 可以将搜索结果按照指定的 field 去重。如果在一次 DSL query 中，collapse 和 sort 同时存在时，DSL 的执行顺序是 select -> collapse -> sort。

2、使用场景

根据关键词搜索 spu_id, 但文档是 SKU，根据 SKU 的名称关键词搜索 spu_id。一个 SPU 通常都有多个 SKU，如果不对 spu_id 进行去重，那么 spu_id 将会有很多的重复。

DSL demo

{
    "query": {
        "match": {
            "desc": "搜索"
        }
    },
    "from": 0,
    "size": 4,
    "collapse": {
        "field": "spu_id"
    },
    "_source": {
        "includes": [
            "spu_id"
        ]
    }
}

response

{
    "took": 0,
    "timed_out": false,
    "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {
            "value": 18,
            "relation": "eq"
        },
        "max_score": null,
        "hits": [
            {
                "_index": "xxx",
                "_type": "_doc",
                "_id": "xxx",
                "_score": 19.782768,
                "_routing": "xxx",
                "_source": {
                    "spu_id": xxx
                },
                "fields": {
                    "spu_id": [
                        "xxx"
                    ]
                }
            },
            {
                "_index": "xxx",
                "_type": "_doc",
                "_id": "xxx",
                "_score": 18.0652,
                "_routing": "xxx",
                "_source": {
                    "spu_id": xxx
                },
                "fields": {
                    "spu_id": [
                        "xxx"
                    ]
                }
            }
        ]
    }
}