数据库题—求连续7天登陆的用户id
思路:一个用户一天有多个登陆日期,我们首先要对日期进行去重复,再使用row_number()over(partition by…order by…)函数获取组内的排名,比如2月1日首次登陆,排名为1,2月2号对应2,2月3号对应3,要是2月4号没有登陆,则2月5号对应4,此时不连续了,我们计算日期与排名结果的差值,要是差值都一样,表示连续登陆。最后,我们按id和差值分组计算,使用having筛选出连续登陆的。
第一步:去重复
select distinct date(date) as 日期,id from 12_15_users
第二步:使用row_number()over(partition by …order by …) 获取组内的排名结果
select *,row_number()over(partition by id order by '日期') as cum
from (select distinct date(date) as 日期,id from 12_15_users) a
第三步:计算登录日期与排名结果的差值
select *,date(日期)-cum as 结果
from (select *,row_number() over(partition by id order by 日期) as cum from (select distinct date(date) as 日期,id from 12_15_users)a)b;
第四步:分组筛选
select id,count(*)
from
(select *,date(日期)-cum as 结果 from (select *,row_number() over(partition by id order by 日期) as cum from (select distinct date(date) as 日期,id from 12_15_users)a)b)c
group by id,结果
having count(*)>=7;