elasticsearch 聚合统计效率测试

elasticsearch 的介绍 就不啰嗦,大家可以上官网看。官网地址如下:

What is Elasticsearch? | Elasticsearch Guide [7.16] | Elastic

因为最近做的业务,数据结构比较复杂 而且量大,因为查询 聚合统计问题,最后考虑 适用elasticsearch 提升业务功能查询统计效率。

场景:品牌名称 是数组类型   品牌类型 也是数据类型  ,数据有1200万左右 数据类型如下

根据输入的名称 统计 名称所函盖的分类,并且每个分类的数量。

例如 输入 C   第二列带有C字母的数据  搜索出180行数据满足 涵盖的分类有5, 30, 32, 35, 43,然后每个分类的数量都加1

开始使用mysql 的 json格式 带二级索引,结果从600多万的数据搜索出3w数据 进行统计 需要20秒左右,而且这个时间 会随着匹配的数据越多而增加时间。让我不得不考虑使用es 看看效果如何 ,一下是测试结果

数据总量

 

took 是查询耗时,单位毫秒,total 是命中总数量  一下是分类 的聚合统计

查询语句如下:


  "query":{
    "bool":{
      "should":[
                {
                    "match":{
                        "brandName":{
                            "query":"Ac"
                        }
                    }
                },
                {
                    "wildcard":{
                        "brandName.keyword":"*Ac*"
                    }
                }
            ],
      "minimum_should_match":"50%",
      "filter":{
        "bool": {
          "must_not":{
            "term":{
              "brandType":9
            }
          }
        }
      }
    }
  },
  "size": 10000,
  "aggs":{
      "type_count":{
          "terms":{
              "field":"brandType",
              "size":10000
          }
      }
  }
}

es 在本地 不存在网络延迟的方面,效率很高,基本在百万级别数据 ,查询 和聚合统计 耗时在500毫秒以内。

关于es 与 spring boot框架整合,请看下一篇 

springboot 整合 elasticsearch 一 安装elasticsearch_q1035331653的博客-CSDN博客

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Elasticsearch 中,可以使用聚合(Aggregation)实现对文档进行聚合统计,其中包括出现次数的统计。下面是一个示例: 假设我们有一个名为 "sales" 的索引,包含以下文档: ``` { "product": "A", "price": 10.0, "timestamp": "2021-08-01T10:00:00Z" } { "product": "B", "price": 15.0, "timestamp": "2021-08-01T10:05:00Z" } { "product": "A", "price": 12.0, "timestamp": "2021-08-01T10:10:00Z" } { "product": "C", "price": 20.0, "timestamp": "2021-08-01T10:15:00Z" } { "product": "A", "price": 8.0, "timestamp": "2021-08-01T10:20:00Z" } { "product": "B", "price": 18.0, "timestamp": "2021-08-01T10:25:00Z" } ``` 现在,我们想要统计每个产品出现的次数,可以使用以下聚合查询: ``` { "aggs": { "products": { "terms": { "field": "product" } } } } ``` 其中,"aggs" 是聚合查询的关键字,"products" 是我们给这个聚合起的名字,"terms" 表示我们要按照某个字段进行分组,"field" 指定了我们要按照哪个字段进行分组。 运行上述查询后,得到的结果如下: ``` { "aggregations": { "products": { "buckets": [ { "key": "A", "doc_count": 3 }, { "key": "B", "doc_count": 2 }, { "key": "C", "doc_count": 1 } ] } } } ``` 其中,"key" 表示产品名称,"doc_count" 表示该产品出现的次数。 如果想要对出现次数进行排序,可以使用以下聚合查询: ``` { "aggs": { "products": { "terms": { "field": "product", "order": { "_count": "desc" } } } } } ``` 其中,"order" 表示按照什么字段进行排序,"_count" 表示按照出现次数进行排序,"desc" 表示降序排列。 运行上述查询后,得到的结果如下: ``` { "aggregations": { "products": { "buckets": [ { "key": "A", "doc_count": 3 }, { "key": "B", "doc_count": 2 }, { "key": "C", "doc_count": 1 } ] } } } ``` 其中,产品 A 出现的次数最多,排在第一位。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值