行动算子是触发了整个作业的执行。因为转换算子都是懒加载,并不会立即执行。
1.reduce()聚合
1)函数签名:
def reduce(f: (T, T) => T): T
2)功能说明:
f函数聚集RDD中的所有元素,先聚合分区内数据,再聚合分区间数据。
2.collect()以数组的形式返回数据集
1)函数签名:
def collect(): Array[T]
2)功能说明:
在驱动程序中,以数组Array的形式返回数据集的所有元素。
3.count()返回RDD中元素个数
1)函数签名:
def count(): Long
2)功能说明:
返回RDD中元素的个数
4.first()返回RDD中的第一个元素
1)函数签名:
def first(): T
2)功能说明:
返回RDD中的第一个元素