9.case when

有一个5000万的用户文件(user_id,name,age),一个2亿记录的用户看电影的记录文件(user_id,url),根据年龄段观看电影的次数进行排序。

用户信息表
在这里插入图片描述
Log表(看电影的记录文件)
在这里插入图片描述

  1. log表进行数据清洗:每个用户看了多少次电影
with t1 as (
    select user_id,
           count(url) as cnt
    from test4log
    group by user_id
)

在这里插入图片描述
2. 对user表进行数据清洗


t2 as (
         select *
                case when age>=0 and age<=10 then '0-10'
                     when age>10 and age<=20 then '10-20'
                     when age>20 and age<=30 then '20-30'
                     when age>30 and age<=40 then '30-40'
                     when age>40 and age<=50 then '40-50'
                     when age>50 and age<=60 then '50-60'
                     when age>60 and age<=70 then '60-70'
                end age_phase
        from test4user
     )

在这里插入图片描述
3. 将t1、t2两表关联合并

t3 as (
         select *
         from t1 join t2 on t1.user_id=t2.user_id
)
select * from t3

在这里插入图片描述
4. 排序合并生成题目所需要的结果

     t3 as (
         select age_phase,
                sum(cnt) sum1
         from t1 join t2 on t1.user_id=t2.user_id
         group by t2.age_phase
     )
select * from t3

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值