大数据Spark入门案例5–统计每广告点击数量排行Top3(scala版本)
1 数据准备
链接:https://pan.baidu.com/s/1afzmL-hNsAJl1_gx_dH2ag
提取码:yybi
agent.log:时间戳,省份,城市,用户,广告,中间字段使用空格分隔。
2 需求分析
统计出每一个省份每个广告被点击数量排行的 Top3
- 首先将获取的数据进行切分,挑选需要的参数:省份+广告
- 以省份和广告位为key,统计当前省份当前广告观看次数sum
- 按省份进行分类
- 排序输出top3数据
3 功能实现
以下代码可以逐步执行并输出,查看输出数据类型和含义
package com.root.opeartor
import org