hiveSQL实现连续问题

文章探讨了如何处理连续日期的问题,包括每天连续和隔天连续的情况。方法涉及日期排序,使用SQL的dense_rank函数,等差数列的概念以及groupby和having子句来过滤满足条件的连续天数。同时,文章提到了去重问题在不同连续天数要求下的处理策略。
摘要由CSDN通过智能技术生成

1 连续问题

1.1 每天连续

 每天连续       不连续
2018-08-08	2018-08-08
2018-08-09	2018-08-10
2018-08-10	2018-08-11
2018-08-11	2018-08-13

1.2 隔天连续

隔一天也连续	隔一天也连续	隔一天也连续	隔两天不连续
2018-08-08	2018-08-08	2018-08-08	2018-08-08
2018-08-09	2018-08-10	2018-08-10	2018-08-11
2018-08-10	2018-08-12	2018-08-11	2018-08-12
2018-08-11  2018-08-13	2018-08-13	2018-08-15

问题解决思想:
1、对日期进行排序。日期有重复的使用dense_rank排序,没有重复的rank,dense_rank,row_number都是结果一样。
2、使用等差数列减等差数列思想实现。日期字段 减 排序字段
3、按需求的连续指标进行group by,having过滤分组后的count(*) 值。
4、注意去重问题。如7天内连续3天,可能出现两次连续(是否需要去重)。而7天内连续4天,最多出现一次连续(不需要去重)
5、如果实现隔天连续,可以参考等差数列减等差数列思想,实现两次相减和分组统计。依次类推,隔n天也连续,就用几次就能实现。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值