Spark算子大致上可分为三大类算子:
Value数据类型的Transformation算子,这种变换不触发提交作业,针对处理的数据项是Value型的数据。
Key-Value数据类型的Transformation算子,这种变换不触发提交作业,针对处理的数据项是Key-Value型的数据。
Action算子,这类算子会触发SparkContext提交作业。
1、foreach
打印输出
2、saveAsTextFile
保存结果到HDFS