运行流程:
1.开发好代码以后打成jar包提交到集群上面去运行。使用的是Spark-submit脚本提交的。首先运行的就是new SparkContext()
2.在SparkContext进行初始化的时候,完成了两个重要的事情:创建了DAGScheduler、TestScheduler
3.TaskScheduler去向master进行注册,并进行资源申请。
4.Executor启动完成以后,去向Driver应用服务进行注册
5.遇到一个action以后,代码才会真正的执行。DAGScheduler会根绝Stage划分算法,划分stage
6.DAGScheduler把TaskSet发送给TaskScheduler
7.TaskScheduler向Executor发送task
8.代码真正执行