43.间断连续登录用户问题

在这里插入图片描述
思路分析:
本题特点在于间断一天登录也认为是连续登录
首先需要对数据做格式化和去重操作user_id,login_date
(1)同会话划分问题一样,先求上一次登录日期
(2)对时间差打标签flag
(3)给每一个会话的建立一个唯一标识(时间差不超过1天的标识相同)
(4)user_id,flag分组下最大最小时间差就是连续登录时间
注:核心点依然是为会话打标签

代码实现:

WITH tmp as(
    --数据格式化、去重
    SELECT 
        user_id,
        date_format(login_datetime, "yyyy-MM-dd") login_date
    from login_events
    group by 
        user_id,
        date_format(login_datetime, "yyyy-MM-dd")
)
select 
    user_id,
    --4.user_id,flag分组下最大最小时间差就是连续登录时间
    datediff(max(login_date), min(login_date)) + 1 max_day_count
from(
        select 
            user_id,
            login_date,
            --3.给每一个会话建立一个唯一标识
            concat(
                user_id,
                sum(flag) over(partition by user_id order by login_date)
            ) as flag
        from(
                SELECT 
                    user_id,
                    login_date,
                    --2.为时间差打标签
                    if(login_date - last_login > 1, 1, 0) as flag
                from(
                        SELECT 
                            user_id,
                            login_date,
                            --1.取用户上一次登录的日期
                            lag(login_date, 1, '1970-01-01') over(PARTITION by user_id order by login_date) last_login
                        from tmp
                    ) t1
            ) t2
    ) t3
group by 
    user_id,
    flag;
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值