大数据面试之手撕SQL题一

目录

一、问题:

二、思想:

三、代码:



一、问题:

hive sql实现查询连续n天登陆的用户

二、思想:

1、选出用户id,以及登陆日期,去重

2、窗口函数按照用户id分组,登陆日期不重复排序

3、date_sub归一化登陆日期

4、按照用户id和归一化后的日期 计算 登陆日期 的数量

三、代码:

select distinct user_id
from (
    select user_id
        , continue_date
        , count(login_date) as continue_day_cnt
    from (
        select user_id
            , login_date
            , date_sub(login_date,row_number() over(partition by user_id order by login_date) )as continue_date
        from (
            select user_id
                , substr(login_time, 1, 10) as login_date
            --from dw.dw_user_login_log
            FROM
            (
                select 1 as user_id
                    ,'2020-10-04' as login_date
                union all 
                select 1 as user_id
                    ,'2020-10-05' as login_date
                union all 
                select 1 as user_id
                    ,'2020-10-06' as login_date
                union all 
                select 1 as user_id
                    ,'2020-10-07' as login_date
            ) t1
            where 1 = 1
            group by user_id
                , substr(login_time, 1, 10)
        ) t
    ) m
    where 1 = 1
    group by user_id
        , continue_date
    having count(login_date) >= 3  -- 连续3天登录,根据业务场景调整这一数值
) x ;

 

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值