Spark有驱动器(Driver),执行器(Executor).
Driver将RDD拆成task,(每个task相当于partition)。Driver将partition1,partition2,partition3…,分发给Executor,Executor执行task.
task通过转化或者行动组成一条逻辑链,每个task再按照这条链运行时互不影响。
Executor有2个作用,
运行成功,告诉Driver
保存结果数据
如果Executor坏了,Driver知道哪个task没成功,再将task重新分配给好的Executor