Spark自定义累加器

object leijiaqi {

  def main(args: Array[String]): Unit = {

    //基本配置
    val conf = new SparkConf().setAppName("myRddLearn").setMaster("local[*]")
    val spark = SparkSession.builder().config(conf).getOrCreate()

    val initRdd = spark.sparkContext.makeRDD(List("hello", "word", "spark", "hive", "hbase"))
    val accumulator = new MyAccumulator
    spark.sparkContext.register(accumulator)
    initRdd.foreach({
      case x => {
        accumulator.add(x)
      }
    })
    println(accumulator.value)
    spark.stop()

  }

}

/**
  * TODO: 自定义累加器
  * 继承AccumulatorV2,实现方法
  * 使用的时候需要注册到spark中去
  */
class MyAccumulator extends AccumulatorV2[String, util.ArrayList[String]] {

  val list = new util.ArrayList[String]()

  //判断是否为空
  override def isZero: Boolean = list.isEmpty

  //复制累加器
  override def copy(): AccumulatorV2[String, util.ArrayList[String]] = {
    new MyAccumulator()
  }

  //重置累加器
  override def reset(): Unit = {
    list.clear()
  }

  //增加一个元素
  override def add(v: String): Unit = {
    if (v.contains("h")) {
      list.add(v)
    }
  }

  //合并每个分区累加器
  override def merge(other: AccumulatorV2[String, util.ArrayList[String]]): Unit = {
    list.addAll(other.value)
  }

  //返回累加器的值
  override def value: util.ArrayList[String] = list
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值