spark07-自定义累加器实现wordCount

该代码示例展示了如何在Scala中使用Spark的AccumulatorV2实现一个自定义的累加器,用于统计单词出现次数。通过创建并注册一个MyAccumulator类,实现了累加器的添加、合并和重置等功能,从而在foreach操作中更新词频计数。
摘要由CSDN通过智能技术生成

object Spark04_Acc_WordCount {
  def main(args: Array[String]): Unit = {
    val spark: SparkConf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc: SparkContext = new SparkContext(spark)

    var rdd=sc.makeRDD(List("hello","spark","hello","scala"))


    //累加器
    //创建累加器对象
    val wcAcc=new MyAccumulator
    //向spark注册
    sc.register(wcAcc,"wordCountAcc")

    rdd.foreach(word=>{
      //使用累加器
      wcAcc.add(word)
    })
    println(wcAcc.value)
  }

  /**
    * 1.集成AccumulatorV2 定义泛型
    *     in:累加器输入的数据类型
    *     out:累加器返回的数据类型
    *     本案例对应的in 为String类型
    *                out 为Map[String,Long]
    *
    * 2.重写方法
    *
    */
  class MyAccumulator extends AccumulatorV2[String,mutable.Map[String,Long]]{
    private var wcMap=mutable.Map[String,Long]()

    //判断是否为初始状态
    override def isZero: Boolean = {
      wcMap.isEmpty
    }

    //复制对象
    override def copy(): AccumulatorV2[String, mutable.Map[String, Long]] = {
      new MyAccumulator()
    }

    //清楚数据
    override def reset(): Unit = {
      wcMap.clear()
    }

    //获取累加器累加的值
    override def add(word: String): Unit = {
          val newCnt=wcMap.getOrElse(word,0L)+1L
          wcMap.update(word,newCnt)
    }

    //合并不同分区,不同Driver端的累加器
    override def merge(other: AccumulatorV2[String, mutable.Map[String, Long]]): Unit = {
      val map1=this.wcMap
      val map2=other.value
      map2.foreach{
        case (word,count)=>{
          val newCnt=map1.getOrElse(word,0L)+count
          map1.update(word,newCnt)
        }
      }
    }

    //获取累加器结果
    override def value: mutable.Map[String, Long] = {
      wcMap
    }
  }
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值