JobMaster负责一个JobGraph的完整执行。
JobMaster只有一个构造函数,入参包括要运行的JobGraph对象。入参包括SchedulerNGFactory,用于创建SchedulerNG调度器,安排Job的执行流程,是Job执行的重要部分。
Job执行的入口函数是startJobExecution。这个函数先调用startJobMasterServices,依次启动心跳服务,slotPool,scheduler,resourceManagerLeaderRetriever。然后,这个函数再调用resetAndStartScheduler,重设Scheduler,然后startScheduling,启动调度,开始执行Job。
resourceManagerLeaderRetriever的功能很简单,通知ResourceManagerLeaderListener监听器集群Leader是谁。
JobMaster可以suspend挂起Job,此时所有Task都被取消。通常,flink集群出现新Leader后,需要挂起Job,重新运行。
JobMaster可以触发存储点savePoint,也可以从存储点重新运行Job。
一句话总结:Scheduler是外部传入的工厂模式创造的,它具体规划Job的执行,JobMaster保存运行上下文各种服务,处理各种资源问题。