数据仓库-Hive SQL处理连续相邻数据(连续响相邻数据个数是未知的)
例如如下场景
- 计算库存连续缺货时长问题。
- 统计连续节假日问题。
- 计算用户访问APP连续登录时长
下面以统计连续节日问题,进行探讨
先来DISS下,这个问题,也是之前在招聘面试中,涉及的最后一道压轴题,99%的人没有正确或者完整回答上来,下面以这个为例子,进行探讨。
如下,从连续日期的是否是否促销的基础数据中,标记出促销的开始日期和结束日期;这个问题发展演变下,和从库存变动记录中,计算连续缺货时长的统计分析,接下大家可以先想下如何解题。
问题解决思路
1.由于连续的日期记录上,第{N}次的分组记录,所以很难使用窗口函数,取连续相邻的数据第一个据,那么只要我们算出这个第{N}次的分组数,即可。
2.如何计算