大数据最新大数据SQL面试题 001,大数据开发开发基础教程视频

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

​题目要求计算每个用户的连续登录天数。连续登录天数是指用户连续登录的天数,即从第一天登录开始,没有中断地登录的天数。这个问题涉及到对登录日志表的排序和条件判断,需要使用 Hive SQL 的窗口函数和条件表达式来解决。

二、难度分析

这个问题的难度属于中等级别。需要对 Hive SQL 的窗口函数和条件表达式有一定的了解,并能够将它们应用到实际的数据分析问题中。同时,对于排序和日期计算也需要有一定的掌握。

三、知识点分析

解决这个问题需要掌握以下知识点:

  1. Hive SQL 的窗口函数:窗口函数可以在查询结果的基础上进行聚合计算。在这个问题中,我们可以使用窗口函数为每个用户的登录日期进行编号。
  2. Hive SQL 的条件表达式:条件表达式可以根据特定的条件进行计算。在这个问题中,我们需要根据登录日期与前一天日期的差值来判断是否连续登录。
  3. Hive SQL 的日期函数:在计算连续登录天数时,需要使用日期函数来进行日期的计算和比较。例如,可以使用 DATEDIFF() 函数计算日期之间的差值。
四、解决方案
数据示例
+----------+------------+| user_id  | login_date |+----------+------------+| 1        | 2020-10-04'|| 1        | 2020-10-05'|| 1        | 2020-10-06'|| 1        | 2020-10-07'|+----------+------------+
具体步骤

1、选出用户id,以及登陆日期,去重

2、窗口函数按照用户id分组,登陆日期不重复排序

3、date_sub归一化登陆日期

4、按照用户id和归一化后的日期计算登陆日期的数量,即为连续登录天数

代码示例
select user_idfrom (    select user_id        , continue_date        , count(login_date) as continue_day_cnt    from (        select user_id            , login_date            , date_sub(login_date,row_number() over(partition by user_id order by login_date asc) )as continue_date        from (            select user_id                , substr(login_time, 1, 10) as login_date            FROM            (                select 1 as user_id                    ,'2020-10-04' as login_date                union all                 select 1 as user_id                    ,'2020-10-05' as login_date                union all                 select 1 as user_id                    ,'2020-10-06' as login_date                union all                 select 1 as user_id                    ,'2020-10-07' as login_date            ) t1            group by user_id                , substr(login_time, 1, 10)        ) t    ) m    group by user_id        , continue_date    having count(login_date) >= 3  -- 连续3天登录,根据业务场景调整这一数值) xgroup by x.user_id;


![img](https://img-blog.csdnimg.cn/img_convert/81d8604d05cc449f2f93d3cd8989e623.png)
![img](https://img-blog.csdnimg.cn/img_convert/cfc6816cc9df188489bf240837ef68bd.png)

**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**

**[需要这份系统化资料的朋友,可以戳这里获取](https://bbs.csdn.net/forums/4f45ff00ff254613a03fab5e56a57acb)**


**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**

从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值