三步走(思路比较简单,连续类的基础题)
- 窗口函数计算连续日期的编号(由于存在同一天同一个用户的多个购买记录窗口函数要用dense_rank)。这里很重要:此处user_id前加distinct是如果不加后面的count函数计数会重复计算同一天的连续两次购买记录而不只是计算连续几天的数量,必须要加。(顺便row_number()是1234,rank()是1114,dense_rank()是1112)
-
SELECT DISTINCT user_id, sales_date, DENSE_RANK() over(PARTITION by user_id ORDER BY sales_date) rn FROM sales_tb
2.编号与日期相减用date_add函数,如果日期连续则号码会相等,连续几天count(*)就有几条。(每个子表必须有自己的名字。)
-
SELECT user_id,COUNT(*) days_count FROM (SELECT DISTINCT user_id,sales_date,DENSE_RANK() over(PARTITION by user_id ORDER BY sales_date) rn FROM sales_tb) a GROUP BY user_id,DATE_ADD(sales_date,INTERVAL - rn day)
3.筛选出超过两天的记录。(连续几天条件就是大于几天)
-
SELECT user_id,COUNT(*) days_count FROM (SELECT DISTINCT user_id,sales_date,DENSE_RANK() over(PARTITION by user_id ORDER BY sales_date) rn FROM sales_tb) a GROUP BY user_id,DATE_ADD(sales_date,INTERVAL - rn day) HAVING days_count >=2 ORDER BY user_id