ES 查询语句总结(2)内嵌对象查询

背景

今年写了一个数据中心的项目,其中有相当一部分的数据查询,用的是ES来做的,涉及到dsl的查询语句,从最开始的简单查询,到后面的复杂的查询,逐步掌握了ES的常用写法,现在总结一下。
文章内的称呼,没有按照ES的官方称呼,例如sql那边的表叫type,sql那边的行叫documents,sql那边的列或者字段叫fields。为了方便起见,统一按照sql的叫法。

查询语句解释说明

书接上回

示例二:

{
    "size": 0,
    "query": {
        "bool": {
            "must": [
                {
                    "bool": {
                        "must": [
                            {
                                "terms": {
                                    "order_status": [
                                        2,
                                        5,
                                        9
                                    ]
                                }
                            },
                            {
                                "nested": {
                                    "path": "order_detail_list",
                                    "query": {
                                        "terms": {
                                            "order_detail_list.goods_id": [123,313,3123,324,5345]
                                        }
                                    }
                                }
                            },
                            {
                                "term": {
                                    "pay_type": 5
                                }
                            },
                            {
                                "range": {
                                    "order_time": {
                                        "gte": "2022-08-01 00:00:00",
                                        "lte": "2022-08-30 23:59:59"
                                    }
                                }
                            }
                        ]
                    }
                },
                {
                    "bool": {
                        "must_not": [
                            {
                                "match_phrase": {
                                    "user_remark": {
                                        "query": "换货单"
                                    }
                                }
                            }
                        ]
                    }
                }
            ]
        }
    },
    "aggs": {
        "total_order_count": {
            "cardinality": {
                "field": "union_pay_order_id",
                "precision_threshold": 50000000
            }
        },
        "order_detail": {
            "nested": {
                "path": "order_detail_list"
            },
            "aggs": {
                "group_by_goods": {
                    "filter": {
                        "terms": {
                            "order_detail_list.goods_id": [123,313,3123,324,5345]
                        }
                    },
                    "aggs": {
                        "total_money": {
                            "sum": {
                                "script": {
                                    "lang": "painless",
                                    "inline": "doc['order_detail_list.count'].value * doc['order_detail_list.price'].value"
                                }
                            }
                        },
                        "total_count": {
                            "sum": {
                                "field": "order_detail_list.count"
                            }
                        }
                    }
                }
            }
        }
    }
}

在这个代码中,对数据的内嵌的内容,做了条件查询,并对内层进行数据聚合。

查询背景:

ES数据的存储结构,不是sql的那种整齐的表格结构,ES由于自身特性,可以做数据嵌套的存储。
本次的查询对象,结构大概如下:

订单表
-订单时间
-订单状态
-订单金额
--订单商品列表
--订单商品1
---商品1的ID
---商品1的数量
---商品1的单价
--订单商品2
---商品2的ID
---商品2的数量
---商品2的单价
--订单商品3
---商品3的ID
---商品3的数量
---商品3的单价

订单表外层是订单的各种信息,例如订单时间,订单状态,收货地址,收货人信息等信息。
由于一个订单一般都不止一个商品,那就会有一个商品列表,对应的购买时商品的单价,商品的数量等信息。

1.查询条件增加内嵌过滤

在这里插入图片描述

上篇提到的加条件的方法,只能加在外层的订单信息的某个字段上,不能加在内层的商品信息上,使用“nested”进入订单明细,然后指定明细内的字段,例如代码中是“order_detail_list.goods_id”指定的商品ID,然后条件才生效。

如果以为这样查出来的结果,就是我们想要的了,那还有点为时尚早,因为这样只是将ES里的原始数据,进行了指定条件的过滤而已。此时在后面直接写聚合,依然还会出错。

2.聚合结果增加内嵌过滤

在这里插入图片描述
1是进入内嵌的商品明细里面,2是按照商品ID进行过滤。

前面在“query”里面加的过滤条件,只能过滤出符合这些条件的原始数据。
举个例子,商品ID为‘123’的商品,在一段时间的销量,就需要先在取出这些商品的数量以及单价,然后进行求和。

"query"阶段的过滤,只是取出来了包含了123商品的订单,这些订单也会包含456,789的商品。

举例订单:
订单1{
商品123,数量2,单价2.5
商品456,数量7,单价1.1
商品789,数量6,单价15.6
},
订单2{
商品123,数量5,单价2.6
商品145,数量7,单价3.1
商品348,数量5,单价9.4
}

如果只是在"query"加了条件,那么在聚合时,就会得到结果:
22.5+71.1+615.6+22.5+73.1+59.4
但是我们需要的是:
22.5+52.6
很显然这样的结果是不符合要求的。

所以在聚合的时候,也要加上商品的过滤条件,图中红框2部分。
顺便提一嘴红框3,这个功能是统计有多少去重后的union_pay_order_id。类似于上篇的统计去重之后的用户个数。

写到这里,有人可以会说,只在内嵌的商品ID加上过滤条件就可以了,就是只加在aggs这个部分,前面的“query”部分应该可以不加这个条件。没错,只在aggs部分加条件,就可以查出商品对应的金额,但是查不出来商品对应的订单的个数。两个查询语句对应的不同结果如下:
在这里插入图片描述
可以看到,query部分加了条件,订单个数统计是没有问题的,没加条件的,订单个数统计的就是全部。其他的求和件数和金额的数据是没有问题的。

3.内嵌对象 数据聚合

在这里插入图片描述
红框内的表示的是ES表的内嵌的字段,"order_detail_list"是一级的字段,“count"是内嵌的二级字段,两个字段用”."隔开。
需要注意到,绿色的框内是一个 乘法,就是说这个和sql一样可以在聚合之前,对两个字段进行相乘。
还有就是在"nested"之后,有两次aggs,第一次是按照goods_id进行聚合,第二次是对商品的金额进行聚合,这里可以类比于sql:

select  sum(count*price), sum(count)
from xxx
where goods_id in (123,313,3123,324,5345)


注意 【不是】 先按照goods_id聚合,后按照数量聚合,类似于这种:
select goods_id, sum(count*price), sum(count)
from xxx
where goods_id in (123,313,3123,324,5345)
group by goods_id
4.查询结果解释
在这里插入代码片

在这里插入图片描述
红框中标出的就是需要的结果的值:外层是订单的个数;内层是内嵌字段的聚合,对商品的金额和件数进行求和,这部分不用详细分析了。

5.扩展

如何实现类似于这个sql的功能呢:

select goods_id, sum(count*price), sum(count)
from xxx
where goods_id in (123,313,3123,324,5345)
group by goods_id

再次加上一个aggs,对内嵌的goods_id聚合就可以了
我的写法:

{
    "size": 0,
    "query": {
        "bool": {
            "must": [
                {
                    "bool": {
                        "must": [
                            {
                                "terms": {
                                    "order_status": [
                                        2,
                                        5,
                                        9
                                    ]
                                }
                            },
                            {
                                "nested": {
                                    "path": "order_detail_list",
                                    "query": {
                                        "terms": {
                                            "order_detail_list.goods_id": [123,313,3123,324,5345]
                                        }
                                    }
                                }
                            },
                            {
                                "term": {
                                    "pay_type": 5
                                }
                            },
                            {
                                "range": {
                                    "order_time": {
                                        "gte": "2022-01-01 00:00:00",
                                        "lte": "2022-08-30 23:59:59"
                                    }
                                }
                            }
                        ]
                    }
                },
                {
                    "bool": {
                        "must_not": [
                            {
                                "match_phrase": {
                                    "user_remark": {
                                        "query": "换货单"
                                    }
                                }
                            }
                        ]
                    }
                }
            ]
        }
    },
    "aggs": {
        "total_order_count": {
            "cardinality": {
                "field": "union_pay_order_id",
                "precision_threshold": 50000000
            }
        },
        "order_detail": {
            "nested": {
                "path": "order_detail_list"
            },
            "aggs": {
                "group_by_goods": {
                    "filter": {
                        "terms": {
                            "order_detail_list.goods_id": [123,313,3123,324,5345]
                        }
                    },"aggregations": {
                        "per_goods": {
                            "terms": {
                                "field": "order_detail_list.goods_id"
                            },
                            "aggs": {
                                "total_money": {
                                    "sum": {
                                        "script": {
                                            "lang": "painless",
                                            "inline": "doc['order_detail_list.count'].value * doc['order_detail_list.price'].value"
                                        }
                                    }
                                },
                                "total_count": {
                                    "sum": {
                                        "field": "order_detail_list.count"
                                    }
                                }
                            }
                        }
                    }
                }
            }
        }
    }
}

结尾

这一部分就先写到这里,这只是我对于ES的自己的总结,难免会有不完整以及错误的地方,欢迎指正。

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Elasticsearch 查询语句可以使用 Query DSL 进行构建。以下是一些常见的查询语句示例: 1. 匹配查询:用于匹配一个特定字段中的值。 ``` GET /_search { "query": { "match": { "title": "elasticsearch" } } } ``` 2. 短语查询:用于匹配一个特定字段中的短语。 ``` GET /_search { "query": { "match_phrase": { "title": "elasticsearch tutorial" } } } ``` 3. 范围查询:用于匹配一个特定字段中的数值范围。 ``` GET /_search { "query": { "range": { "age": { "gte": 18, "lte": 30 } } } } ``` 4. 布尔查询:用于组合多个查询条件。 ``` GET /_search { "query": { "bool": { "must": [ { "match": { "title": "elasticsearch" } }, { "match": { "description": "tutorial" } } ] } } } ``` 5. 聚合查询:用于对结果进行聚合计算。 ``` GET /_search { "aggs": { "avg_age": { "avg": { "field": "age" } } } } ``` 以上仅是一些常见的查询语句示例,Elasticsearch 还支持许多其他类型的查询。请参阅官方文档以了解更多信息。 ### 回答2: Elasticsearch 是一个开源的分布式搜索和分析引擎,它提供了强大的查询功能来检索和分析大量的数据。 Elasticsearch 查询语句可以使用 JSON 格式来构建,主要分为两种类型:查询查询语句和过滤查询语句查询查询语句用于根据特定的条件从索引中检索文档。常见的查询类型包括匹配查询、多字段查询、范围查询和布尔查询等。匹配查询用于在指定字段中搜索指定的词语,多字段查询可以在多个字段中搜索相同的词语,范围查询支持按照范围来搜索结果,而布尔查询则可以通过逻辑运算符组合多个查询条件。 过滤查询语句用于根据特定的条件过滤文档。与查询查询语句不同的是,过滤查询不会计算相关度分数,只关心是否匹配。常见的过滤查询类型有 term 过滤、范围过滤和 bool 过滤等。term 过滤用于精确匹配一个词语,范围过滤用于按照指定范围过滤结果,bool 过滤则可以通过逻辑运算符组合多个过滤条件。 除了查询和过滤,Elasticsearch 还支持一些聚合函数(aggregations),用于对搜索结果进行统计和分析。聚合查询可以对结果集进行分组、排序、计算总和、平均值等操作,从而提供更丰富的数据分析功能。 总之,Elasticsearch 查询语句是非常灵活和强大的,可以根据不同的需求组合不同的查询和过滤条件,实现高效的数据检索和分析。 ### 回答3: Elasticsearch是一个开源的分布式搜索和分析引擎,提供了强大的查询功能。查询语句是用户用来向Elasticsearch发送请求并获取结果的指令。 Elasticsearch查询语句可以分为两种,一种是基于URI的查询语句,另一种是基于请求体的查询语句。 基于URI的查询语句通常用于简单的查询请求,语法类似于URL。例如,要查询名为"products"的索引下的所有文档,可以使用以下查询语句: GET /products/_search 基于请求体的查询语句更为灵活,可以实现更复杂的查询功能。请求体是一个JSON对象,包含了查询的参数和条件。以下是一个常见的基于请求体的查询语句示例: POST /products/_search { "query": { "match": { "name": "手机" } } } 上述查询语句使用了"match"查询,指定了要查询的字段为"name",查询的关键词为"手机"。这将返回所有名为"手机"的文档。 此外,Elasticsearch还提供了许多其他类型的查询语句,包括布尔查询、范围查询、模糊查询等。用户可以根据需要选择合适的查询语句以实现精确的搜索结果。 总之,Elasticsearch查询语句是通过URI或请求体来发送查询请求的指令,使用不同类型的查询语句可以实现不同的搜索功能。用户可以根据自己的需求选择合适的查询语句,并通过分析返回的结果来满足他们的搜索和分析需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值