Scala中自定义累加器的使用

最新推荐文章于 2022-04-16 14:31:52 发布

掏粪工

最新推荐文章于 2022-04-16 14:31:52 发布

阅读量2.8k

点赞数 1

分类专栏：大数据 Scala

本文链接：https://blog.csdn.net/u011115903/article/details/81347127

版权

使用自定义累加器的目的：

如果要使用多个累加器的话，会使程序变的复杂，不便于扩展维护

代码实现

import org.apache.spark.{AccumulatorParam, SparkConf, SparkContext}

object CustomAccumulator extends AccumulatorParam[String] {
  override def zero(initialValue: String): String = "SESSION_COUNT=0|TIME_PERIOD_1s_3s=0|TIME_PERIOD_4s_6s=0|STEP_PERIOD_1_3=0|STEP_PERIOD_4_6=0"

  override def addInPlace(v1: String, v2: String): String = add(v1, v2)

  // v1 : SESSION_COUNT=0|TIME_PERIOD_1s_3s=0|TIME_PERIOD_4s_6s=0|STEP_PERIOD_1_3=0|STEP_PERIOD_4_6=0
  // v2 : TIME_PERIOD_1s_3s
  // return: SESSION_COUNT=0|TIME_PERIOD_1s_3s=1|TIME_PERIOD_4s_6s=0|STEP_PERIOD_1_3=0|STEP_PERIOD_4_6=0
  // 这里有三种情况：
  // 1、最常见的情况。v1 = 上一次的累计值，v2 = 传入的一个字段
  // 2、如果只有一个分区，在计算结束的时候，v1 &#

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

掏粪工

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Scala中自定义累加器的使用

使用自定义累加器的目的：如果要使用多个累加器的话，会使程序变的复杂，不便于扩展维护代码实现import org.apache.spark.{AccumulatorParam, SparkConf, SparkContext}object CustomAccumulator extends AccumulatorParam[String] { overr...
复制链接

扫一扫