SPARK task执行与资源分配的关系

最新推荐文章于 2022-12-08 00:32:26 发布

ChaosJ

最新推荐文章于 2022-12-08 00:32:26 发布

阅读量5k

点赞数 6

分类专栏： spark 文章标签： spark

本文链接：https://blog.csdn.net/chaosj/article/details/53158928

版权

spark 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

SPARK task执行与资源分配的关系

问题背景

执行spark某个sparkjob申请的资源是150个Executor，但是直至job执行结束（大约30多分钟），分配给该job的Executor个数是49个；
该job正常试行时间大约是14分钟，但由于此次分配该job的Executor个数少于150导致job执行过长大约30多分钟；
问题：为什么没有获得足够的资源，job就开始执行了?

问题分析

执行该job时候集群资源不足，导致执行job结束也没有分配足够的资源
分配了部分Executor，该job就开始执行task，应该是task的调度线程和Executor资源申请是异步的；

该问题相关的conf

spark.scheduler.maxRegisteredResourcesWaitingTime ：

Maximum amount of time to wait for resources to register before scheduling begins.
default:30s

spark.scheduler.minRegisteredResourcesRatio：

The minimum ratio of registered resources (registered resources / total expected resources) (resources are executors in yarn mode, CPU cores in standalone mode and Mesos coarsed-grained mode ['spark.cores.max' value is total expected resources for Mesos coarse-grained mode] ) to wait for before scheduling begins. Specified as a double between 0.0 and 1.0. Regardless of whether the minimum ratio of resources has been reached, the maximum amount of time it will wait before scheduling begins is controlled by config spark.scheduler.maxRegisteredResourcesWaitingTime.
default : 0.8 for YARN mode; 0.0 for standalone mode and Mesos coarse-grained mode

关键代码分析

1._taskScheduler.postStartHook()->taskScheduler.waitBackendReady()

  SparkContext 初始化的时候回调用_taskScheduler.postStartHook()
 postStartHook() ：
     override def postStartHook() {
        waitBackendReady()
      }

2.taskScheduler.waitBackendReady()->SchedulerBackend.isReady()即CoarseGrainedSchedulerBackend.isReady()

override def isReady(): Boolean = {
    if (sufficientResourcesRegistered) {
      logInfo("SchedulerBackend is ready for scheduling beginning after " +
        s"reached minRegisteredResourcesRatio: $minRegisteredRatio")
      return true
    }
    //时间判断逻辑：
    //System.currentTimeMillis() - createTime) >= maxRegisteredWaitingTimeMs；maxRegisteredWaitingTimeMs默认是30s
    if ((System.currentTimeMillis() - createTime) >= maxRegisteredWaitingTimeMs) {
      logInfo("SchedulerBackend is ready for scheduling beginning after waiting " +
        s"maxRegisteredResourcesWaitingTime: $maxRegisteredWaitingTimeMs(ms)")
      return true
    }
    false
  }

上述方方法isReady中的sufficientResourcesRegistered，调用的是是其子类YarnSchedulerBackend.sufficientResourcesRegistered():
判断逻辑是：如果现在分配的Executor的个数>需要申请的Executor个数*spark.scheduler.minRegisteredResourcesRatio ；其中spark.scheduler.minRegisteredResourcesRatio 默认是0.8

override def sufficientResourcesRegistered(): Boolean = {
    totalRegisteredExecutors.get() >= totalExpectedExecutors * minRegisteredRatio
  }
//-----------------------------------------------
 override val minRegisteredRatio =
    if (conf.getOption("spark.scheduler.minRegisteredResourcesRatio").isEmpty) {
      0.8
    } else {
      super.minRegisteredRatio
    }

结论

如果想等待申请完所有的资源再执行job的：需要将spark.scheduler.maxRegisteredResourcesWaitingTime设置的很大；spark.scheduler.minRegisteredResourcesRatio 设置为1

但设置成上述配置的的话有一个问题：
如果设置spark.scheduler.maxRegisteredResourcesWaitingTime为1个小时，假设期待的Executor个数是300个，则由于集群资源紧张，job在一个小时之内申请并占有200个Executor，但是最后还是在maxRegisteredResourcesWaitingTime结束没有达到预期的300个Executor，等待期间会浪费这些资源；

还是应该综合考虑具体情况设置这个两个参数！

Reference

https://issues.apache.org/jira/browse/SPARK-2635
https://issues.apache.org/jira/browse/SPARK-1946
http://spark.apache.org/docs/latest/configuration.html
SPARK-2.0.0源码

ChaosJ

关注

6
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
SPARK task执行与资源分配的关系

SPARK task执行与资源分配的关系问题背景执行spark某个sparkjob申请的资源是150个Executor，但是直至job执行结束（大约30多分钟），分配给该job的Executor个数是49个；该job正常试行时间大约是14分钟，但由于此次分配该job的Executor个数少于150导致job执行过长大约30多分钟；问题：为什么没有获得足够的资源，job就开始执行了?问题分析
复制链接

扫一扫

专栏目录