leetcode,sql,连续5天活跃用户id统计
select distinct tmp4.id,a.name
from
(select tmp2.id
from
(select tmp.id,subdate(login_date,con) diff
from
(select tmp1.id,tmp1.login_date,
dense_rank() over(partition by tmp1.id order by tmp1.login_date asc) con
from (
select id,login_date
from Logins
group by id,login_date
) tmp1 #tmp1是对每一日的登陆去重,让一个用户的一个日期只对应一个一个id
) tmp #tmp是对用户分类然后对日期排序分组计数
) tmp2 #tmp2是对日期与分组计数求差,然后得到的连续日期都是相同的一个日期,后面再对求得的diff与id分组
#筛选出id,即可
group by tmp2.diff,tmp2.id
having count(tmp2.diff)>4) tmp4
left join Accounts a
on tmp4.id=a.id
关于对数据去重,之前我想到的是分组,然后对同一id的同一日期的用户去重。去重用distinct呀。但是在哪里用成了问题,在窗口函数的partition 后面肯定不行,order by 后面肯定也不行呀,会报错。
看了别人的代码,发现,可以用group去重呀
select id,login_date
from Logins
group by id,login_date
这样就找到了每个id每个日期唯一的信息了。