Spark自定义累加器


import org.apache.spark.util.AccumulatorV2

import scala.collection.mutable

/**
 * @author tianmin
 * @date 2020/3/3 0003
 * @notes Spark自定义累加器
 */
class SessionAccumulator extends AccumulatorV2[String, mutable.HashMap[String, Int]] {

  // 维护一个自定义累加器
  val countMap = new mutable.HashMap[String, Int]()

  // 是否为空
  override def isZero: Boolean = {
    countMap.isEmpty
  }

  // 复制一个累加器
  override def copy(): AccumulatorV2[String, mutable.HashMap[String, Int]] = {
    val acc = new SessionAccumulator
    // map拼接
    acc.countMap ++= this.countMap
    acc
  }

  // 清空累加器
  override def reset(): Unit = {
    countMap.clear()
  }

  // 添加
  override def add(v: String): Unit = {
    // 不存在,则添加(v,0)
    if (!countMap.contains(v)) {
      countMap += (v -> 0)
    }

    // 统一加1
    countMap.update(v, countMap(v) + 1)
  }

  // 两个Map合并,key相同的累加
  override def merge(other: AccumulatorV2[String, mutable.HashMap[String, Int]]): Unit = {
    other match {
      case acc: SessionAccumulator =>
        acc.countMap.foldLeft(this.countMap) {
          case (map, (k, v)) => {
            map += (k -> (map.getOrElse(k, 0) + v))
          }
        }
    }
  }

  override def value: mutable.HashMap[String, Int] = {
    this.countMap
  }
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值