算子和方法
算子也就是Operator
(操作)
不同的称呼是为了区分RDD
的方法和Scala
集合对象的方法
Scala集合对象
的方法都是在同一个节点的内存中完成的
RDD
的方法可以将计算逻辑发送到Executor
端(分布式节点)执行
RDD
的方法 外部操作都是在Driver
端执行,而方法内部的逻辑代码是在Executor
端执行
执行的差异性
以foreach
为例,属于不同类的foreach
,其执行顺序不同:
val sparkConf: SparkConf = new SparkConf().setMaster("local[*]")<