SparkSQL实战小项目之热门商品top3(无需自定义UDAF函数)
一、说明及需求分析
参考我的老师的博客 SparkSQL实战小项目之热门商品top3_若兰幽竹-CSDN博客
二、准备测试数据
参考我的老师的博客 SparkSQL实战小项目之热门商品top3_若兰幽竹-CSDN博客
三、思路分析
- 测试数据分别位于user_visit_action、city_info、product_info表中,需多表联合查询,保留可用字段,筛选出可用数据。
- 统计某地区某城市某商品出现的次数即为某地区某城市某商品的点击量
- 统计出某地区、某商品总点击量(为后面求百分比做准备)
- 为了容易操作,将第2步的临时视图和第3步的临时视图联合在一起(为后面求百分比做准备)
- 求百分比,并拼接字符串,获得“城市备注”的数据
- 排序、展示结果