Spark源码精读之 ApplicationMaster

最新推荐文章于 2024-09-07 23:36:56 发布

MichaelZhu

最新推荐文章于 2024-09-07 23:36:56 发布

阅读量434

点赞数

分类专栏： Spark源码精读文章标签： spark scala 大数据

本文链接：https://blog.csdn.net/a5685263/article/details/129538141

版权

Spark源码精读专栏收录该内容

4 篇文章 1 订阅

订阅专栏

Spark任务在YARN上以集群模式运行时，从ApplicationMaster的main函数开始，涉及YarnRMClient的实例化，用于向ResourceManager注册和申请资源。ApplicationMaster通过YarnAllocator分配资源，并初始化AMEndpoint。整个流程包括用户代码执行和资源管理两部分，最终完成Spark任务的执行。

摘要由CSDN通过智能技术生成

1、背景介绍

Spark版本：V2.3.2

2、关键代码

Spark任务提交后，若是集群模式，会将org.apache.spark.deploy.yarn.ApplicationMaster类的main函数作为主入口，并启动进程来运行此类。

def main(args: Array[String]): Unit = {
  master = new ApplicationMaster(amArgs)
  System.exit(master.run())
}

我们看下ApplicationMaster函数实例化的时候，有哪些值得关注的信息。

ApplicationMaster
private val client = doAsUser { new YarnRMClient() }

YarnRMClient
private var amClient: AMRMClient[ContainerRequest] = _

client就是YarnRMClient函数实例化的对象。
amClient，是AMRMClientImpl函数实例化的对象，后续注册Driver注册AM，就是这个对象去实现的。
接下来是master.run()方法，这里有两条线，一条线是执行–class指向的函数，也就是咱们的Spark代码，另一条线就是向RM注册并分配Containers。

// 第一条线
userClassThread = startUserApplication()

// 第二条线
val totalWaitTime = sparkConf.get(AM_MAX_WAIT_TIME)
try {
  val sc = ThreadUtils.awaitResult(sparkContextPromise.future,
    Duration(totalWaitTime, TimeUnit.MILLISECONDS))
  if (sc != null) {
    rpcEnv = sc.env.rpcEnv
    val driverRef = createSchedulerRef(
      sc.getConf.get("spark.driver.host"),
      sc.getConf.get("spark.driver.port"))
    registerAM(sc.getConf, rpcEnv, driverRef, sc.ui.map(_.webUrl))
    registered = true
  } 
  userClassThread.join()

在注册AM的同时，会初始化amClient并由amClient对象完成向RM注册，并返回类型为YarnAllocator的allocator对象。
然后再初始化AM endpoint。
最后由allocator分配资源。

ApplicationMaster
allocator = client.register(driverUrl,
  driverRef,
  yarnConf,
  _sparkConf,
  uiAddress,
  historyAddress,
  securityMgr,
  localResources)
  
YarnRMClient
amClient = AMRMClient.createAMRMClient()
 
ApplicationMaster
rpcEnv.setupEndpoint("YarnAM", new AMEndpoint(rpcEnv, driverRef))
allocator.allocateResources()