Hive求连续几天的问题

人之所教,我亦教之。强梁者不得其死,吾将以为教父🎡

原表是这样的:

在这里插入图片描述

我们想求谁连续两天来买过商品。

分析:也就是说,我们想要知道,在某一个人的消费时间里,他有没有连续两天的消费记录。

解题思路:

1. 先按名字分组,时间升序排序,分好组后给每天的消费编号(如果一天有很多次消费记录要记得去重,一天只保留一条记录)

在这里插入图片描述

2. 在上次的基础上,求出时间差

计算时间差的方法:用时间减去编号,求出时间差,然后一组内时间差结果相等的说明他连续两天来过。
为什么要求时间差:
假设有如下时间,已经按照时间升序排好序了

时间编号
2022-08-171
2022-08-182
2022-08-193
2022-08-214
2022-08-255
2022-08-266
然后我用上述方法计算出时间差:
时间编号时间差
2022-08-1712022-08-16
2022-08-1822022-08-16
2022-08-1932022-08-16
2022-08-2142022-08-17
2022-08-2552022-08-20
2022-08-2662022-08-20

你会发现,凡是前面的时间连着的,计算的时间差都相同,所以只要我们计算出时间差,然后过滤一下就可以了

在这里插入图片描述

3. 按姓名和时间进行分组,然后统计有几条时间差相同的数据

在这里插入图片描述

4. 过滤出我们想要的数据

在这里插入图片描述

所以最终的Hive sql 如下:

select
  name,
  count(*) c
from
  (
    select
      *,
      date_sub(orderdate, rn) ds
    from
      (
        select
          *,
          row_number() over(partition by name order by orderdate) rn
        from
          business
      ) t1
  ) t2
group by
  name,
  ds
having
  c >= 2;
  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

阿年、嗯啊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值