ES 基础查询语句组合

我是酷毙程序猿

已于 2022-02-14 09:17:58 修改

阅读量554

点赞数

分类专栏： es 文章标签： elasticsearch linq mariadb

于 2021-05-14 10:02:13 首次发布

本文链接：https://blog.csdn.net/qq_35190486/article/details/116779874

版权

es 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

一 :使用过程中记录以及筛选条件

二：查询样列基础查询语法结构 sql 语句以及对应的 es 查询语法

不为空查询

SQL

SELECT * FROM orders where last_buy_time IS NOT NULL

ES SQL

$esParmas= [
"size"=>0,
"query"=>["bool"=>["filter"=>["exists"=>["field"=>"last_buy_time"]]]]
];

根据条件查询去重计数

SQL

select count(DISTINCT(member_id)) as all_total from member_analysis where member_type IN("consumer","potential") AND last_buy_time >= '1605801599' and buy_times > '2' and avg_amount > '18700' AND (dealer_name LIKE "%xunke%" OR dealer_name LIKE "%xunke%" ) AND (platform LIKE "%xuns%" OR platform LIKE "%xun%")

ESSQL
$esParmas=[
                                 "size"=>0,
       "query"=>[
               "bool"=>[
                          "filter"=>[
                                       ["terms"=>["member_type"=>["consumer","potential"]]],
                                         ["range"=>["last_buy_time"=>["gte"=>1605801599]]],
                                       ["range"=>["buy_times"=>["gt"=>2]]],
                                       ["range"=>["avg_amount"=>["gt"=>18700]]],
                                       [
                                                  "bool"=>["should"=>[
                                                                           ["wildcard"=>["dealer_name"=>"*xunke*"]],
                                                                           ["wildcard"=>["dealer_name"=>"*xunke*"]]
                                                             ]
                                                   ]
                                       ],
                                       [
                                                  "bool"=>["should"=>[
                                                                           ["wildcard"=>["platform"=>"*xuns*"]],
                                                                           ["wildcard"=>["platform"=>"*xun*"]]
                                                             ]
                                                   ]
                                       ],
                               ]
                   ]
       ],
        "aggs"=>["member_id_quchong"=>["cardinality"=>["field"=>"member_id"]]]
];

备注：其中包含 cardinlity 是起到去重计数作用，和 "collapse"=>["field"=>"member_id"] 中 collapse 去重相比 cardinlity 返回查询去重计数和结果，而 collapse 返回查询去重的结果。

wildcard 是起到 sql 中 like 查询效果但是他必须前后加* 类似 like 的前后加%，而且和 match match_phrase 区别。 match 查询分子后相邻和不相邻的字符串只要保安字符串的文档都会查出， match_phrase 和 wildcard 查询效果一样只要包含相邻的该字符串的文档都可以查询出来，类似精准模糊查询。

根据条件分组查询计数

SQL

SELECT count(1),reg_source FROM member_analysis where member_type IN("consumer","potential") and reg_time >=1377808000 and reg_time<=1585670400

ESSQL

根据条件多字段分组计数（来源，年月分为分组计数）

SQL

SELECT count(1),reg_source FROM member_analysis where member_type IN("consumer","potential") and reg_time >=1377808000 and reg_time<=1585670400 GROUP BY reg_source,date_ym

ESSQL

$esParmas= [
"size"=>0,
"query"=>[
                  "bool"=>[
       "filter"=>[
            ["terms"=>["member_type"=>["consumer","potential"]]],
            ["range"=>["reg_time"=>["gte"=>1377808000,"lte"=>1585670400]]]
       ]
   ]
],
"aggs"=>[
     "group_by_reg_source"=>[
   "terms"=>["script"=>"doc['reg_source.raw'].values +'#split#'+ doc['date_ym'].values","size"=>1000]
     ]
]
];

备注：聚合中 script 用于连接某些字段作为一组进行分组处理。 reg_source 如果是text 设置成 keyword 要这里 reg_source 的keyword 别名为 raw

根据条件分组求和

SQL

SELECT count(1),sum(payed) FROM member_analysis where member_type IN("consumer","potential") and reg_time >=1377808000 and reg_time<=1585670400 GROUP BY province_id

ESSQL

$esParmas= [
"size"=>0,
"query"=>[
     "bool"=>[
       "filter"=>[
            ["terms"=>["member_type"=>["consumer","potential"]]],
            ["range"=>["reg_time"=>["gte"=>1377808000,"lte"=>1585670400]]]
       ]
   ]
],
"aggs"=>[
"group_by_member_type"=>[
        "terms"=>["field"=>"province_id","size"=>1000],
        "aggs"=>["total_sum"=>["sum"=>"field"=>"payed"]]
   ]
]
];

根据条件分组求和只计算桶的个数只返回桶的个数（返回满足分组后每个分组大于2的桶的个数）不返回桶的数据明细

①url 参数后要加 filter_path=aggregations.usercount

$url="http://****************:9200/orders/_search?filter_path=aggregations.usercount";
$esParmas= [
"size"=>0,
"query"=>[
                  "bool"=>[
       "filter"=>[
            ["terms"=>["member_type"=>["consumer","potential"]]],
            ["range"=>["order_time"=>["gte"=>1377808000,"lte"=>1585670400]]]
       ]
   ]
],
"aggs"=>[
     "usercount"=>["sum_bucket"=>["buckets_path"=>"usercount-bucket>usercount-metric"]],
     "usercount-bucket"=>[
   "terms"=>["field"=>"member_id","min_doc_count"=>2,"size"=>10000000],
                "aggs"=>["usercount-metric"=>["max"=>["script"=>["lang"=>"painless","source"=>"return 1"]]]]
     ]
]
];

返回满足分组计数大于2的所有的桶并计算每个桶内的个数

sql

POST usercount-bucket/_search
{
"size": 0,
"aggs": {
    "usercount-bucket": {
      "terms": {
        "field": "province_id",
        "min_doc_count": 2
      },
      "aggs": {
        "count": {
          "max": {
            "script":{
              "lang":"painless",
              "source":"return 1"
            }
          }
        }
      }
    },
    "usercount": {
      "sum_bucket": {
        "buckets_path": "usercount-bucket>count"
      }
    }
}
}

结果

返回分组查询满足桶内大于2的个数的详细信息包含桶内的数据

$esParmas= [
"size"=>0,
"query"=>[
                  "bool"=>[
       "filter"=>[
            ["terms"=>["member_type"=>["consumer","potential"]]],
            ["range"=>["reg_time"=>["gte"=>1377808000,"lte"=>1585670400]]]
       ]
   ]
],
"aggs"=>[
     "usercount"=>["sum_bucket"=>["buckets_path"=>"usercount-bucket>usercount-metric"]],
     "usercount-bucket"=>[
   "terms"=>["field"=>"province_id","size"=>100,"min_doc_count"=>2],
                "aggs"=>["usercount-metric"=>["cardinality"=>["field"=>"province_id"]]]
     ]
]
];

我是酷毙程序猿

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ES 基础查询语句组合

一 :使用过程中记录以及筛选条件二：查询样列基础查询语法结构 sql 语句以及对应的 es 查询语法根据条件查询去重计数SQLselect count(DISTINCT(member_id)) as all_total from member_analysis where member_type IN("consumer","potential") AND last_buy_time >= '1605801599' and buy_times > '...
复制链接

扫一扫