scala方法—aggregate

最新推荐文章于 2023-01-09 15:26:48 发布

Nelson_hehe

最新推荐文章于 2023-01-09 15:26:48 发布

阅读量808

点赞数 1

分类专栏： # Scala 文章标签： scala语法 aggregate

本文链接：https://blog.csdn.net/hehe_soft_engineer/article/details/103356789

版权

Scala 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

Scala中的aggregate方法

这个函数还是比较有意思的，在spark中也会常常用到

一、首先举一个计算字符串内字符出现次数的例子：

//统计字母出现的频率映射
def strfreq(str:String):mutable.Map[Char,Int]={
  val strlist=str.toList
  //strlist.aggregate()
  val countsMap=strlist.aggregate(mutable.Map[Char,Int]())((agg:mutable.Map[Char,Int], char)=>{
    if(!agg.contains(char)){
      agg.put(char,1)
    }else{
      agg.put(char,agg(char)+1)
    }
    agg
  },(agg1:mutable.Map[Char,Int],agg2:mutable.Map[Char,Int])=> {//由于这里没有分区，则此处并没有执行此方法
      for((word,count)<-agg1){
        if(!agg2.contains(word)){
          agg2.put(word,1)
        }else{
          agg2.put(word,agg2(word)+count)
        }
      }
      agg2
    }
  )
  countsMap
}

测试：

val str="hgjhdg"
println(strfreq(str))

测试结果截图：

然后来深入解析一下这个aggregate函数

https://www.jianshu.com/p/e0fd975055b3

二、对aggregate的理解

1.先来看官方API

https://www.scala-lang.org/api/2.12.10/

aggregate方法（2.13.0后已被其他函数替换，但是作用类似）：

函数形式：

函数内容：

2.大致描述：

该方法对子集合（元素）进行聚合运算，此方法 类似于foldLeft，它不要求返回值必须是元素类型的超类（ 并不要求返回值类型与接受值类型一致），此外，aggregate方法将集合分片 （split），它可以对多个被分割的集合并行操作（对分块的集合进行操作： seqop）【 最少对一个元素进行操作】，并最后组合（ combop）起来【 最少0次组合操作】。

3.参数详解：

(1)可以看到主要有五个参数：B , z , seqop ，A , combop

①B：集合类型

②z：作为积累的初始值，指在z的基础上执行后面的函数操作，其类型应该和函数返回值的类型相同

③seqop：定义在一个部分（partition）内对元素的操作【相当于一个表达式】，并返回该部分的计算结果（results）

④A：表示要执行aggregate函数的集合的元素，在seqop方法体内一一执行对应操作

⑤combop：该运算符用于合并来自不同分区的结果，并最终返回想要的聚合结果

(2)对API给出的例子进行解释

首先是传入集合为['a','b','c']，返回的值为'a'、'b'、'c'三个字符（列表内字符串）转化为int类型后的整型值的和

详细如图：

三、看看被替换成foldLeft(z)(seqop)怎么使用

可以看最新的2.13.1版本的API

https://www.scala-lang.org/api/2.13.1/

其中参数表示的内容说的很明白了，表面上看在这里其实就是将前面的aggregate的seqop以前的部分保留下来，combop部分去除了，现在还没有学习spark，不知道这个改动对并发计算有什么影响，是否真的可以使用这个函数完全代替aggregate，等学习spark后，再来补上这个困惑。

Nelson_hehe

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
scala方法—aggregate

Scala中的aggregate方法这个函数还是比较有意思的，在spark中也会常常用到一、首先举一个计算字符串内字符出现次数的例子：//统计字母出现的频率映射def strfreq(str:String):mutable.Map[Char,Int]={ val strlist=str.toList //strlist.aggregate() val countsMa...
复制链接

扫一扫

专栏目录