二、action行动算子操作
1.foreach算子
主要是用于算子的遍历输出
2.count算子
统计RDD中元素的个数
3.collect算子
对算子进行聚合,风险较大,一般结合filter使用
4.take&first算子
first获取元素中的第一个元素。take获取元素中的前N个元素
5.takeOrdered(n)
对元素先进行排序,然后获取前N个元素
6.reduce算子
reduce对一个rdd执行聚合操作,并返回结果
7.countByKey算子
统计Key出现的次数
8.saveAsXxx算子
保存文件到指定的位置
9.foreachPartition算子
按分区循环执行,一般用于分区保存,效率较高