最常见的行动操作:
reduce():接收一个函数作为参数,操作两个RDD的元素类型的数据并返回一个同样类型的新元素。
简单的例子就是函数+,可以用它来对我们的RDD进行累加。
reduce()可以很方便的计算出RDD中所有元素的总和、元素的个数,以及其他类型的聚合操作。
要求函数的返回值类型与我们所操作的RDD中的元素类型相同。
aggregate():需要提供我们期待返回的类型的初始值。然后通过一个函数把RDD中的元素合并起来放入累加器。
考虑到每个节点是在本地进行累加的,最终还需要提供第二个函数来将累加器两两合并。
可以用aggregate()来计算RDD的平均值
RDD的一些行动操作会以普通集合或者值的形式将RDD的部分或者全部数据返回驱动器程序中。
collect():将整个RDD的内容返回,通常