目录
(1)TaskScheduler和TaskSetManager
1.ShuffleMapStage 与 ResultStage
一、spark指令运行过程
1.yarn集群环境执行spark指令过程
(1)
执行SparkSubmit启动命令,并由yarnClient执行submitApplication启动yarn Client
执行SparkSubmit,其中这个类有两个对象:SparkSubmitArguments,YarnClusterApplication
- SparkSubmitArguments:用于记录启动命令的后续参数。
- YarnClusterApplication:我们在参数中指令了yarn,并且启动模式使用集群。表示我们使用该对象启动
YarnClusterApplication对象内有一个Client,同时Client内还有一个yarnClient。
yarnClient执行