牛客网 SQL大厂面试真题篇 SQL9 2021年11月每天新用户的次日留存率

描述

用户行为日志表tb_user_log

iduidartical_idin_timeout_timesign_cin
110102021-11-01 10:00:002021-11-01 10:00:421
210290012021-11-01 10:00:002021-11-01 10:00:090
310390012021-11-01 10:00:012021-11-01 10:01:500
410190022021-11-02 10:00:092021-11-02 10:00:280
510390022021-11-02 10:00:512021-11-02 10:00:590
610490012021-11-02 11:00:282021-11-02 11:01:240
710190032021-11-03 11:00:55

2021-11-03 11:01:24

0
810490032021-11-03 11:00:452021-11-03 11:00:550
910590032021-11-03 11:00:532021-11-03 11:00:590
1010190022021-11-04 11:00:552021-11-04 11:00:590

(uid-用户ID, artical_id-文章ID, in_time-进入时间, out_time-离开时间, sign_in-是否签到)

问题:统计2021年11月每天新用户的次日留存率(保留2位小数)

  • 次日留存率为当天新增的用户数中第二天又活跃了的用户数占比。
  • 如果in_time-进入时间out_time-离开时间跨天了,在两天里都记为该用户活跃过,结果按日期升序。

输出示例

示例数据的输出结果如下

dtuv_left_rate
2021-11-010.67
2021-11-021.00
2021-11-030.00

解释:

11.01有3个用户活跃101、102、103,均为新用户,在11.02只有101、103两个又活跃了,因此11.01的次日留存率为0.67;

11.02有104一位新用户,在11.03又活跃了,因此11.02的次日留存率为1.00;

11.03有105一位新用户,在11.04未活跃,因此11.03的次日留存率为0.00;

11.04没有新用户,不输出。

题解: 

第一步:查看每天的活跃用户,因为存在跨天的情况,所以需要把in_time和out_time拼起来


select uid,date(in_time) dt
from tb_user_log 
union
select uid,date(out_time) dt
from tb_user_log 

第二步:查看每个用户的最小登陆日(每天的新用户)

select uid,min(date(in_time)) dt
from tb_user_log
group by uid

 第三步:将上面两张表左连接,得到每天新用户第二天是否登陆表。只有该用户第一天登录并且第2天依旧登陆才有整个记录,否则右表记录为空。

注意:第一天登录并且第2天依旧登陆:on 条件 datediff(t2.dt,t1.dt)=1

select *
from(
    -- 两张表左连接,得到每天新用户第二天是否登陆表。只有是同一用户并且该用户第2天依旧登陆才会保留整个记录,否则右表记录为空
    -- 每个用户的最小登陆日(每天的新用户,即第一次登录的才是新用户)
    select uid,min(date(in_time)) dt
    from tb_user_log
    group by uid
)t1
left join(
    -- 每天的活跃用户,因为存在跨天的情况,所以需要把in_time和out_time拼起来
    select uid,date(in_time) dt
    from tb_user_log 
    union
    select uid,date(out_time) dt
    from tb_user_log 
)t2
on t1.uid=t2.uid and  datediff(t2.dt,t1.dt)=1

 第四步:计算当天新增的用户数中第二天又活跃了的用户数占比

当天新增的用户数:t1.uid

第二天又活跃了的用户数:t2.uid

select t1.dt,round(count(t2.uid)/count(t1.uid),2) uv_rate
from(
    -- 两张表左连接,得到每天新用户第二天是否登陆表。只有是同一用户并且该用户第2天依旧登陆才会保留整个记录,否则右表记录为空
    -- 每个用户的最小登陆日(每天的新用户,即第一次登录的才是新用户)
    select uid,min(date(in_time)) dt
    from tb_user_log
    group by uid
)t1
left join(
    -- 每天的活跃用户,因为存在跨天的情况,所以需要把in_time和out_time拼起来
    select uid,date(in_time) dt
    from tb_user_log 
    union
    select uid,date(out_time) dt
    from tb_user_log 
)t2
on t1.uid=t2.uid and  datediff(t2.dt,t1.dt)=1
where date_format(t1.dt,'%Y-%m')='2021-11'
group by t1.dt
order by t1.dt

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值