引言
这一小节我们将就之前写的几篇博文,从提交Job,到Stage划分,到任务分发,再到任务的执行,这一完整过程做一系统的回顾。在这一过程中理清思路,明确几篇文章中涉及到的调度关系和逻辑关系。
Spark作业提交到执行过程
上面这个图摘自张包峰的csdn博客,这个图很清晰的描述了作业提交执行的整个过程,略去了细节原理,给人一种清晰直观的流程概况。
通过该图结合一下我之前的博文来描述一下文章的内容和相互关系:
DAGScheduler源码浅析介绍了SparkContext通过DAGScheduler的runJob提交作业,其中通过DAGScheduler的事件队列来处理JobSubmitted事件来处理提交的Job。
DAGScheduler源码浅析2对DAGScheduler中涉及的两个重要组件进行的补充介绍。