fastspark | 用SparkCore和SparkSQL两种方式实现各省份广告TopN统计

最新推荐文章于 2022-07-25 23:59:50 发布

pomelorange

最新推荐文章于 2022-07-25 23:59:50 发布

阅读量379

点赞数

分类专栏：大数据 Spark 文章标签： spark

本文链接：https://blog.csdn.net/whisky_12/article/details/105543881

版权

该博客介绍了如何利用SparkCore和SparkSQL两种方式，对各省份广告点击量进行TopN统计。通过具体实例，展示了在大数据处理中这两种方法的运用。

摘要由CSDN通过智能技术生成

内容

本文讲述使用SparkCore和SparkSQL实现每个省份点击量最多的前三个广告id，测试数据如下

SparkCore


import org.apache.spark.rdd.RDD
import org.apache.spark.{
   SparkConf, SparkContext}

import scala.collection.mutable.ArrayBuffer

/**
  * Program: fastspark
  * Package:  
  * Description: Created by felahong on 2020/4/15 12:03
  * TODO 统计每个省份点击TOP3的广告
  */

case class AdClick(province: Int, ad: Int)

object ProvinceAdTopThree {
   

  def main(args: Array[String]): Unit = {
   

    val conf =

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

pomelorange

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
fastspark | 用SparkCore和SparkSQL两种方式实现各省份广告TopN统计

内容本文讲述使用SparkCore和SparkSQL实现每个省份点击量最多的前三个广告id，测试数据如下省份id 广告id1 1001 1001 1001 1121 1011 1121 1021 1021 1031 1121 1121 1011 1122 1002 1212 1012 1212 1042 1212 1112 1042 1032 11...
复制链接

扫一扫