1 需求描述
统计硅谷影音视频网站的常规指标,各种 TopN 指标:
-- 统计视频观看数 Top10
-- 统计视频类别热度 Top10
-- 统计出视频观看数最高的 20 个视频的所属类别以及类别包含 Top20 视频的个数
-- 统计视频观看数 Top50 所关联视频的所属类别排序
-- 统计每个类别中的视频热度 Top10,以 Music 为例
-- 统计每个类别视频观看数 Top10
-- 统计上传视频最多的用户 Top10 以及他们上传的视频观看次数在前 20 的视频
2 数据结构
1)视频表

2)用户表

3 准备工作
3.1 准备表
1)需要准备的表
创建原始数据表:gulivideo_ori,gulivideo_user_ori,
创建最终表&

这篇博客详细介绍了如何使用Hive进行硅谷影音视频网站的数据统计,包括视频观看数Top10、视频类别热度Top10等各类指标的计算。内容涵盖了数据结构设计、表的创建与填充,以及Tez引擎的安装背景。
订阅专栏 解锁全文
439

被折叠的 条评论
为什么被折叠?



