1、Scala集合方法与RDD算子区别
RDD的方法和Scala集合对象的方法不一样
集合对象的方法都是在同一个节点的内存中完成的
RDD的方法可以将计算逻辑发送到Executor端(分布式节点)执行
为了区分不同的处理效果,所以将RDD的方法称之为算子
RDD的方法之外的操作都是在Driver端执行的,而方法内部的逻辑代码是在Excutor端执行的
2、RDD转换算子与行动算子
转换算子,是将RDD进行各种形式的变换,但不执行
转换算子处理完RDD,还是RDD,可能RDD内的元素类型变了
行动算子,像是启动按钮,将之前一系列转换算子一并执行
行动算子处理完RDD,就不是RDD了,而是常见的变量或集合类型