Spark的整体流程:
Client提交应用,Master找到一个Worker启动Driver,Driver向Master或资源管理器申请资源,之后将应用转化为RDD Graph,再由DAGScheduler将RDD Graph 转化为Stage 的有向无换图提交给TaskScheduler,由TaskScheduler 提交任务给Executor执行。在任务执行过程中,其他组件协同合作,确保整个应用的顺利执行。
Spark的整体流程:
Client提交应用,Master找到一个Worker启动Driver,Driver向Master或资源管理器申请资源,之后将应用转化为RDD Graph,再由DAGScheduler将RDD Graph 转化为Stage 的有向无换图提交给TaskScheduler,由TaskScheduler 提交任务给Executor执行。在任务执行过程中,其他组件协同合作,确保整个应用的顺利执行。