经典sql题(一)求连续登录不少于三天用户

示例数据

假设我们的 test 表有以下数据:

iddate
12023-10-01 08:00:00
12023-10-01 09:00:00
12023-10-02 10:00:00
12023-10-03 11:00:00
22023-10-01 10:00:00
22023-10-02 12:00:00
22023-10-03 14:00:00
22023-10-04 15:00:00
32023-10-01 16:00:00
第一步:去重并提取日期
SELECT 
    id,
    SUBSTR(date, 1, 10) AS date1
FROM 
    test
GROUP BY 
    id, SUBSTR(date, 1, 10);

结果(表 table1):

iddate1
12023-10-01
12023-10-02
12023-10-03
22023-10-01
22023-10-02
22023-10-03
22023-10-04
32023-10-01
第二步:为每个用户和日期生成序列号
SELECT 
    id,
    date1,
    DATE_ADD(date1, -ROW_NUMBER() OVER (PARTITION BY id ORDER BY date1)) AS date2
FROM (
    SELECT 
        id,
        SUBSTR(date, 1, 10) AS date1
    FROM 
        test
    GROUP BY 
        id, SUBSTR(date, 1, 10)
) AS table1;  -- 使用 'table1' 作为别名

结果(表 table2):

iddate1date2
12023-10-012023-10-01
12023-10-022023-10-01
12023-10-032023-10-01
22023-10-012023-10-01
22023-10-022023-10-01
22023-10-032023-10-01
22023-10-042023-10-01
32023-10-012023-10-01
第三步:统计连续的登录天数
SELECT 
    id,
    date2,
    COUNT(*) AS day_cnt
FROM (
    SELECT 
        id,
        date1,
        DATE_ADD(date1, -ROW_NUMBER() OVER (PARTITION BY id ORDER BY date1)) AS date2
    FROM (
        SELECT 
            id,
            SUBSTR(date, 1, 10) AS date1
        FROM 
            test
        GROUP BY 
            id, SUBSTR(date, 1, 10)
    ) AS table1  -- 保持一致,使用 'table1'
) AS table2  -- 使用 'table2' 作为新的别名
GROUP BY 
    id, date2
HAVING 
    COUNT(*) >= 3;

结果(最终结果):

iddate2day_cnt
12023-09-303
22023-09-304

完整步骤解析

  1. 去重提取日期

    • 查询:提取每个用户的唯一登录日期。
    • 结果表 table1:显示每个用户的唯一日期。
  2. 为每个用户生成序列号

    • 查询:为每个用户的日期生成序号,并计算 date2
    • 结果表 table2:显示用户的日期和对应的 date2
  • 步骤
    • 使用 ROW_NUMBER() 函数,按照日期顺序为每个用户的登录日期分配一个序号。

    • 例如,对于用户 ID = 1,假设他们的日期是 2023-10-012023-10-022023-10-03ROW_NUMBER() 将为它们生成序号 1、2 和 3。

    • date2 是通过将每个日期减去它的序号得到的。这个操作的目的是为了检测连续的日期。

    • 例如:

      • 对于 2023-10-01,序号是 1,计算为 2023-10-01 - 1,得到 2023-09-30
      • 对于 2023-10-02,序号是 2,计算为 2023-10-02 - 2,得到 2023-09-30
      • 对于 2023-10-03,序号是 3,计算为 2023-10-03 - 3,得到 2023-09-30

通过这样的计算,我们可以将连续的日期归类到同一个组中。因为给定的 date2 值会相同(如上例中都是 2023-09-30),这使得后续的统计操作(如计算连续登录天数)变得简单。具体来说:

  • 连续性检测:当两个日期的 date2 相同,说明它们是连续的。因此,进行统计时可以通过分组 date2 来确定每个用户连续登录的天数。

以用户 ID = 1 为例:

iddate1ROW_NUMBERdate2
12023-10-0112023-09-30
12023-10-0222023-09-30
12023-10-0332023-09-30
  1. 统计连续的登录天数
    • 查询:根据 date2 统计每个用户的连续登录天数,筛选出连续登录天数大于等于3天的用户。
    • 最终结果:显示符合条件的用户 ID 和连续登录天数。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值