思路分析
第一步,我先从视频表和用户行为表中筛选出当天的搞笑类型视频的曝光点赞数据,按照视频 id 和视频创建者 user_id 分组求和,得到一个子表 a。
第二步,我再从视频创建者表中获取视频创建者名称,和子表 a 连接,得到一个子表 b。
第三步,我再从视频表和用户行为表中筛选出近 30 天的搞笑类型视频的曝光点赞数据,按照视频 id 分组求和,得到一个子表 c。
第四步,我把子表 b 和子表 c 连接,得到最终的 ads 表,并插入到分区为 20210718 的目标表中。
答案获取
建议你先动脑思考,动手写一写再对照看下答案,如果实在不懂可以点击下方卡片关注
, 回复:大厂sql
即可。
参考答案适用HQL,SparkSQL,FlinkSQL,即大数据组件,其他SQL需自行修改。
加技术群讨论
点击下方卡片关注
后 联系我进群
附表
用户行为表:t_user_video_action_d分区:ds(格式 yyyyMMdd) 主键:user_id、video_id
含义:一个 user 对一个视频的所有行为聚合,每天增量字段:
字段名 | 字段含义 | 类型 |
---|---|---|
user_id | 用 户 id | string |
vide |