HiveSQL 面试题 - 从订单表中查找符合指定购买条件的用户

1 需求

从订单明细表(order_detail)中查询出所有购买过商品 1 和商品 2,但是没有购买过商品 3 的用户。

  • 订单信息表 order_info
order_id (订单id)user_id (用户id)create_date (下单日期)total_amount (订单金额)
11012021-09-3029000.00
101032020-10-0228000.00
  • 订单明细表 order_detail
order_detail_id(订单明细id)order_id(订单id)sku_id(商品id)create_date(下单日期)price(商品单价)sku_num(商品件数)
1112021-09-302000.002
2132021-09-305000.005
221042020-10-026000.001
231052020-10-02500.0024
241062020-10-022000.005
  • 期望结果如下
user_id
103
105

2 实现

  • 思路分析

由于订单信息分为了订单信息表和订单明细表,所以需要先将两张表的数据关联起来,取出需要的 user_id 和 sku_id 信息。

购买过商品 1 和商品 2,但是没有购买过商品 3 的用户,可以将每个用户所有购买的商品聚合成集合,再判断集合中是否包含指定的商品就可以找出符合条件的用户。

  • 实现

1 关联数据表,查出每个用户购买过的商品

SELECT
  user_id,
  collect_set (sku_id) sku_set
from
  order_detail od
  inner join order_info oi on oi.order_id = od.order_id
group by
  user_id
user_idsku_set
101[“1”,“3”,“4”,“5”,“7”,“8”,“9”,“12”]
1010[“1”,“2”,“3”,“6”,“7”,“8”,“10”,“11”,“12”]
102[“1”,“2”,“3”,“4”,“6”,“7”,“8”,“9”,“10”,“11”,“12”]
103[“1”,“2”,“4”,“5”,“6”,“8”,“10”,“11”,“12”]
104[“1”,“3”,“4”,“5”,“6”,“7”,“10”,“11”,“12”]
105[“1”,“2”,“4”,“5”,“6”,“7”,“8”,“9”,“11”,“12”]
106[“1”,“2”,“3”,“4”,“5”,“7”,“8”,“9”,“10”,“11”,“12”]
107[“1”,“2”,“3”,“4”,“5”,“6”,“7”,“8”,“9”,“10”,“11”,“12”]
108[“1”,“2”,“3”,“4”,“5”,“6”,“8”,“9”,“10”,“11”]
109[“1”,“2”,“3”,“4”,“5”,“6”,“8”,“10”,“11”,“12”]

2 使用商品集合筛选符合条件的用户

select user_id
from (SELECT user_id,
             collect_set(sku_id) sku_set
      from order_detail od
           inner join order_info oi on oi.order_id = od.order_id
      group by user_id) t1
where array_contains(sku_set, '1')
  and array_contains(sku_set, '2')
  and NOT array_contains(sku_set, '3');
user_id
103
105
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值