❤️博客主页: 楚生辉
❤️系列专栏:【LeetCode刷题】
❤️一句短话: 坚持不懈,孜孜不倦
1.题目描述
表: UserVisits
+-------------+------+
| Column Name | Type |
+-------------+------+
| user_id | int |
| visit_date | date |
+-------------+------+
该表没有主键。
该表包含用户访问某特定零售商的日期日志。
假设今天的日期是 ‘2021-1-1’ 。
编写 SQL 语句,对于每个 user_id ,求出每次访问及其下一个访问(若该次访问是最后一次,则为今天)之间最大的空档期天数 window
返回结果表,按用户编号 user_id 排序。
查询格式如下示例所示:
UserVisits 表:
+---------+------------+
| user_id | visit_date |
+---------+------------+
| 1 | 2020-11-28 |
| 1 | 2020-10-20 |
| 1 | 2020-12-3 |
| 2 | 2020-10-5 |
| 2 | 2020-12-9 |
| 3 | 2020-11-11 |
+---------+------------+
结果表:
+---------+---------------+
| user_id | biggest_window|
+---------+---------------+
| 1 | 39 |
| 2 | 65 |
| 3 | 51 |
+---------+---------------+
对于第一个用户,问题中的空档期在以下日期之间:
- 2020-10-20 至 2020-11-28 ,共计 39 天。
- 2020-11-28 至 2020-12-3 ,共计 5 天。
- 2020-12-3 至 2021-1-1 ,共计 29 天。
由此得出,最大的空档期为 39 天。
对于第二个用户,问题中的空档期在以下日期之间:
- 2020-10-5 至 2020-12-9 ,共计 65 天。
- 2020-12-9 至 2021-1-1 ,共计 23 天。
由此得出,最大的空档期为 65 天。
对于第三个用户,问题中的唯一空档期在 2020-11-11 至 2021-1-1 之间,共计 51 天。
2.代码实现
先使用窗口函数排序对原表根据id分组后排序,排完序添加上2021-01-01,添加好之后,就可以进行计算取得最大值
select
t2.user_id as user_id,
max(DATEDIFF(t2.date,t2.visit_date)) as biggest_window
from
(select
user_id,
visit_date,
LAG(visit_date,1,'2021-01-01') over( PARTITION BY user_id ORDER BY visit_date DESC) as date
from
(select
user_id,
visit_date,
ROW_NUMBER() over ( PARTITION BY user_id ORDER BY visit_date DESC ) AS rn
from UserVisits ) t1) t2
group by t2.user_id
窗口函数的执行顺序为:原理:先按 字段名 进行排序,排序完后,再执行前面的函数计算。
因此,我们可以将t1这个表直接优化掉,代码就变成
select
t2.user_id as user_id,
max(DATEDIFF(t2.date,t2.visit_date)) as biggest_window
from
(select
user_id,
visit_date,
LAG(visit_date,1,'2021-01-01') over( PARTITION BY user_id ORDER BY visit_date DESC) as date
from UserVisits
) t2
group by t2.user_id

被折叠的 条评论
为什么被折叠?



