Elasticsearch(es)多种方式查询索引是否存在重复数据

1.获取重复数据

GET test.project/_search
{
    "size":0,
    "aggs":{
        "field":{
            "terms":{
                "field":"id.keyword",
                "size":3000,
                "min_doc_count":1
            }
        }
    }
}

2. 统计去重数目

GET test.project/_search
{
  "size": 0, 
  "aggs": {
    "count": {
      "cardinality": {
        "field": "id.keyword"
      }
    }
  }
}

3. 返回去重内容

3.1 aggs的方式 

GET test.project/_search
{
    "query":{
        "match_all":{

        }
    },
    "aggs":{
        "type":{
            "terms":{
                "field":"id.keyword",
                "size":10
            },
            "aggs":{
                "id_top":{
                    "top_hits":{
                        "_source":{
                            "includes":"name"
                        },
                        "sort":[
                            {
                                "create_date.keyword":{
                                    "order":"desc"
                                }
                            }
                        ],
                        "size":1
                    }
                }
            }
        }
    },
    "size":0
}

3.2 折叠方式

GET test.project/_search
{
    "query":{
        "match_all":{

        }
    },
    "collapse":{
        "field":"id.keyword"
    },
    "_source":{
        "includes":"name"
    }
}

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Elasticsearch是一个开源的分布式搜索和分析引擎,它使用倒排索引来高效地存储和检索数据。在使用Elasticsearch时,有时候可能会遇到一些索引无法查询数据的情况,其原因可能包括以下几个方面。 1. 数据未正确导入:在创建索引并将数据导入到Elasticsearch之前,有时候可能会出现数据导入的问题。这可能包括数据源文件格式的不一致、数据源文件丢失或数据导入过程中的错误等。解决这个问题的方法是检查数据源文件,确保数据正确导入到Elasticsearch。 2. 索引不存在:如果尝试查询索引Elasticsearch中不存在,那么自然无法查询数据。在这种情况下,需要检查索引的存在性,并确保正确指定了要查询索引名称。如果索引确实不存在,可以通过创建索引并将数据导入来解决这个问题。 3. 查询条件错误:有时候,索引中可能没有与给定查询条件匹配的数据。在这种情况下,需要检查查询条件是否正确并与索引中的数据相匹配。这可能包括字段名称的拼写错误、查询语法错误或查询值与索引中的数据类型不匹配等。确保查询条件正确是解决这个问题的关键。 4. 数据分片问题:Elasticsearch索引数据分片存储在不同的节点上,查询数据时涉及到数据分片的分布和路由。如果某个索引数据分片在查询时无法被正确路由到,并且查询操作跨越了多个节点,那么可能导致查询不到数据的情况。在这种情况下,需要检查数据分片的分布和路由情况,并确保查询操作能够正确地访问到分片所在的节点。 综上所述,当索引无法查询数据时,可能存在数据导入问题、索引不存在、查询条件错误或数据分片问题等原因。通过排查这些问题并采取相应的解决措施,可以解决索引无法查询数据的情况。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值