需求
表 Accounts:
±--------------±--------+
| Column Name | Type |
±--------------±--------+
| id | int |
| name | varchar |
±--------------±--------+
id 是该表主键.
该表包含账户 id 和账户的用户名.
表 Logins:
±--------------±--------+
| Column Name | Type |
±--------------±--------+
| id | int |
| login_date | date |
±--------------±--------+
该表无主键, 可能包含重复项.
该表包含登录用户的账户 id 和登录日期. 用户也许一天内登录多次.
写一个 SQL 查询, 找到活跃用户的 id 和 name.
活跃用户是指那些至少连续 5 天登录账户的用户.
返回的结果表按照 id 排序.
结果表格式如下例所示:
Accounts 表:
±—±---------+
| id | name |
±—±---------+
| 1 | Winston |
| 7 | Jonathan |
±—±---------+
Logins 表:
±—±-----------+
| id | login_date |
±—±-----------+
| 7 | 2020-05-30 |
| 1 | 2020-05-30 |
| 7 | 2020-05-31 |
| 7 | 2020-06-01 |
| 7 | 2020-06-02 |
| 7 | 2020-06-02 |
| 7 | 2020-06-03 |
| 1 | 2020-06-07 |
| 7 | 2020-06-10 |
±—±-----------+
Result 表:
±—±---------+
| id | name |
±—±---------+
| 7 | Jonathan |
±—±---------+
id = 1 的用户 Winston 仅仅在不同的 2 天内登录了 2 次, 所以, Winston 不是活跃用户.
id = 7 的用户 Jonathon 在不同的 6 天内登录了 7 次, , 6 天中有 5 天是连续的, 所以, Jonathan 是活跃用户.
输入
输出
with t1 as (
select *,
dense_rank() over (partition by id order by login_date) as rn1
from logins
),t2 as (
select distinct *,to_char(login_date-rn1*'1 day'::interval,'YYYY-MM-DD') as date1
from t1
),t3 as (
select id,date1,count(1) as cnt
from t2
group by id,date1
)
select t3.id,a.name
from t3,accounts a
where t3.id=a.id and cnt>=5
order by t3.id