SQL学习(10):微观到宏观的困难题目解答 | 大厂真题实例-每天新用户的次日留存率

SQL学习(10):微观到宏观的困难题目解答 | 大厂真题实例-每天新用户的次日留存率

题目来源:《牛客题霸:SQL大厂真题》02用户增长场景(某度信息流) SQL164 2021年11月每天新用户的次日留存率

前言:微观到宏观——困难题目的新解题思路和代码框架

经过前几个章节的学习和对应题目的锻炼,相信文章所描述的解题思路和代码框架都已经被掌握。总结来看,先书写select-from-where代码框架,再分解题目,逐步填充的解题方法具有宏观到微观的特点,适合思路清晰的简单题目和部分中等题目,解答清晰、书写方便、不容易出现语法遗漏问题。

但当题目比较复杂,尤其需要多层子查询时,这种方法带来的代码书写思路却往往容易出现遗漏,导致错误。原因在于,我们解决困难问题的常见方法是微观到宏观的,即将困难问题拆分为简单的小问题再进行组合。 如果还使用前几章提到的框架,则在宏观下找微观时容易出现遗漏。

本章开始,将从微观到宏观介绍适合困难问题的新解题思路和代码框架。

1.题目描述

用户行为日志表tb_user_log:

uid-用户ID
artical_id-文章ID
in_time-进入时间
out_time-离开时间
sign_in-是否签到

问题:统计2021年11月每天新用户的次日留存率(保留2位小数),命名为uv_left_rate

注:次日留存率为当天新增的用户数中第二天又活跃了的用户数占比。如果in_time-进入时间和out_time-离开时间跨天了,在两天里都记为该用户活跃过,结果按日期升序。

2.问题分析

第一步:拆解问题并分块

困难问题通常需要使用子查询,涉及join、union等函数。我们需要根据最终要求的提取数据,反推其来自的查询条件、子查询部分等。

问题拆分:

  1. 2021年11月每日新用户次日留存率:
  • 2021年11月——新用户和次日留存都需要在11月内,即用户第一次进入和再次进入都需要在11月。如果使用min得到的新用户子查询中使用where条件,只会得到11月中首次进入,并不等于在11月首次注册;需要使用having
  • 新用户——2021年11月之前未进入过
  • 次日留存——只关注新用户注册后的次日。题目注意事项中说明,如果首次进入停留时间跨天,则直接记录为次日留存,因此需要离开时间的数据,不能舍去
  • 留存率——新用户中次日留存人数/前一天新用户,共同点在于都来自于新用户集合
  1. 保留2位小数——round
  2. 需要使用join,注意null
  3. group by和order by不要忘记

问题思路总结:

  1. 筛选新注册用户——子查询

  2. 筛选活跃时间——子查询。

    问题层面看需要再次进入的时间和注册时间相差1天,特殊情况下离开时间和注册时间差1,总体来看相当于寻找比注册时间多1天的对应数据,此时in和out无实际差别,因此使用union将in_time和out_time合为一体

  3. 子查询join——需要使用外连接,将新用户子查询全部保留。注意可能出现NULL,总体查询时需要注意处理。条件:uid相同和时间差࿰

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值