【3天掌握Spark】--内核调度详解

最新推荐文章于 2023-06-05 13:24:46 发布

一只楠喃

最新推荐文章于 2023-06-05 13:24:46 发布

阅读量289

点赞数 1

分类专栏： spark 文章标签： spark 大数据

本文链接：https://blog.csdn.net/weixin_48143996/article/details/117232414

版权

spark 专栏收录该内容

13 篇文章 1 订阅

订阅专栏

Spark之内核调度

内核调度之引例WordCount

Spark的核心是根据RDD来实现的，Spark Scheduler则为Spark核心实现的重要一环，其作用就是任务调度。
Spark的任务调度就是如何组织任务去处理RDD中每个分区的数据，根据RDD的依赖关系构建DAG，基于DAG划分Stage，将每个Stage中的任务发到指定节点运行。

以词频统计WordCount程序为例，Job执行是DAG图
在这里插入图片描述
运行词频统计WordCount，截取4040监控页面上DAG图：

当RDD调用Action函数（Job触发函数）时，产出1个Job，执行Job。

1、将Job中所有RDD按照依赖关系构建图：DAG图（有向无环图）

2、将DAG图划分为Stage阶段，分为2种类型

ResultStage，对结果RDD进行处理Stage阶段
ShuffleMapStage，此Stage阶段中最后1个RDD产生Shuffle

3、每个Stage中至少有1个RDD或多个RDD，每个RDD有多个分区，每个分区数据被1个Task处理

每个Stage中有多个Task处理数据，每个Task处理1个分区数据

内核调度之RDD 依赖

RDD 间存在着血统继承关系，其本质上是 RDD之间的依赖（Dependency）关系。
[每个RDD记录，如何从父RDD得到的，调用哪个转换函数]

在这里插入图片描述

从DAG图上来看，RDD之间依赖关系存在2种类型：

窄依赖，2个RDD之间依赖使用有向箭头表示
宽依赖，又叫Shuffle 依赖，2个RDD之间依赖使用S曲线有向箭头表示

窄依赖（Narrow Dependency）

定义：父 RDD 与子 RDD 间的分区是一对一的，一（父RDD）对一（子RDD)

在这里插入图片描述

Shuffle 依赖（宽依赖 Wide Dependency）

定义：父 RDD 中的分区可能会被多个子 RDD 分区使用，[一（父）对多（子）](

在这里插入图片描述

内核调度之DAG和Stage

  在Spark应用执行时，每个Job执行时（RDD调用Action函数时），依据最后一个RDD（调用Action函数RDD），依据RDD依赖关系，向前推到，构建Job中所有RDD依赖关系图，称之为DAG图。

在这里插入图片描述

当构建完成Job DAG图以后，继续从Job最后一个RDD开始，依据RDD之间依赖关系，将DAG图划分为Stage阶段，当RDD之间依赖为Shuffle依赖时，划分一个Stage。

对于窄依赖，RDD之间的数据不需要进行Shuffle，多个数据处理可以在同一台机器的内存中完
成，所以窄依赖在Spark中被划分为同一个Stage；
对于宽依赖，由于Shuffle的存在，必须等到父RDD的Shuffle处理完成后，才能开始接下来的计
算，所以会在此处进行Stage的切分。

在这里插入图片描述

可以运行词频统计WordCount查看对应DAG图和Stage阶段
在这里插入图片描述

把DAG划分成互相依赖的多个Stage，划分依据是RDD之间的宽依赖，Stage是由一组并行的Task组成。
在这里插入图片描述

1、Stage切割规则：从后往前，遇到宽依赖就切割Stage。

2、Stage计算模式：pipeline管道计算模式
pipeline只是一种计算思想、模式，来一条数据然后计算一条数据，把所有的逻辑走完，然后落地。
以词频统计WordCount为例：
从HDFS上读取数据，每个Block对应1个分区，当从Block中读取一条数据以后，经过flatMap、map和reduceByKey操作，最后将结果数据写入到本地磁盘中（Shuffle Write）。
block0: hadoop spark spark
|textFile
RDD-0 hadoop spark spark
|flatMap
RDD-1 hadoop\spark\spark
|map
RDD-2 (hadoop, 1)(spark, 1)(spark, 1)
|reduceByKey
写入磁盘 hadoop, 1 || spark, 1\ spark, 1
3、准确的说：一个task处理一串分区的数据，整个计算逻辑全部走完

在这里插入图片描述

内核调度之Spark Shuffle

MapReduce框架中Shuffle过程，整体流程图如下：

在这里插入图片描述
Spark在DAG调度阶段会将一个Job划分为多个Stage，上游Stage做map工作，下游Stage做reduce工作，其本质上还是MapReduce计算框架。

Shuffle是连接map和reduce之间的桥梁，它将map的输出对应到reduce输入中，涉及到序列化反序列化、跨节点网络IO以及磁盘读写IO等。
在这里插入图片描述
Spark的Shuffle分为Write和Read两个阶段，分属于两个不同的Stage，前者是Parent Stage的最后一步，后者是Child Stage的第一步。

Stage划分为2种类型：

1）、ShuffleMapStage，在Spark 1个Job中，除了最后一个Stage之外，其他所有的Stage都是此类型
- 将Shuffle数据写入到本地磁盘，ShuffleWriter
- 在此Stage中，所有的Task称为：ShuffleMapTask
2）、ResultStage，在Spark的1个Job中，最后一个Stage，对结果RDD进行操作
- 会读取前一个Stage中数据，ShuffleReader
- 在此Stage中，所有的Task任务称为ResultTask。

[ShuffleMapTask要进行Shuffle，ResultTask负责返回计算结果，一个Job中只有最后的Stage采用ResultTask，其他的均为ShuffleMapTask。](

内核调度之Job 调度流程

当启动Spark Application的时候，运行MAIN函数，首先创建SparkContext对象（构建DAGScheduler和TaskScheduler）。

第一点、DAGScheduler实例对象
- 将每个Job的DAG图划分为Stage，依据RDD之间依赖为宽依赖（产生Shuffle）
第二点、TaskScheduler实例对象
- 调度每个Stage中所有Task：TaskSet，发送到Executor上执行
- 每个Stage中会有多个Task，所有Task处理数据不一样（每个分区数据被1个Task处理），但是处理逻辑一样的。
- 将每个Stage中所有Task任务，放在一起称为TaskSet。
- 当RDD调用Action函数（比如count、saveTextFile或foreachPartition）时，触发一个Job执行，调度中流程如下图所示：
  
  Spark RDD通过其Transactions操作，形成了RDD血缘关系图，即DAG，最后通过Action的调用，触发Job并调度执行。
1）、DAGScheduler负责Stage级的调度，主要是将DAG切分成若干Stages，并将每个Stage打包成TaskSet交给TaskScheduler调度。
2）、TaskScheduler负责Task级的调度，将DAGScheduler给过来的TaskSet按照指定的调度策略分发到Executor上执行，调度过程中SchedulerBackend负责提供可用资源，其中SchedulerBackend有多种实现，分别对接不同的资源管理系统。
Spark的任务调度总体来说分两路进行，一路是Stage级的调度，一路是Task级的调度。
一个Spark应用程序包括Job、Stage及Task：
第一、Job是以Action方法为界，遇到一个Action方法则触发一个Job；
第二、Stage是Job的子集，以RDD宽依赖(即Shuffle)为界，遇到Shuffle做一次划分；
第三、Task是Stage的子集，以并行度(分区数)来衡量，分区数是多少，则有多少个task。

内核调度之Spark 基本概念

Spark Application运行时，涵盖很多概念，主要如下表格：
在这里插入图片描述

内核调度之并行度

在Spark Application运行时，并行度可以从两个方面理解：

1）、资源的并行度：由节点数(executor)和cpu数(core)决定的
2）、数据的并行度：task的数据，partition大小

Task数目要是core总数的2-3倍为佳

参数spark.defalut.parallelism默认是没有值的，如果设置了值，是在shuffle的过程才会起作用

在实际项目中，运行某个Spark Application应用时，需要设置资源，尤其Executor个数和CPU核数，如何计算？

首先确定总的CPU Core核数，依据数据量（原始数据大小）及考虑业务分析中数据量
再确定Executor个数，假定每个Executor核数，获取个数
最后确定Executor内存大小，[一般情况下，每个Executor内存往往是CPU核数2-3倍](

一只楠喃

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【3天掌握Spark】--内核调度详解

Spark之内核调度内核调度之引例WordCountSpark的核心是根据RDD来实现的，Spark Scheduler则为Spark核心实现的重要一环，其作用就是任务调度。Spark的任务调度就是如何组织任务去处理RDD中每个分区的数据，根据RDD的依赖关系构建DAG，基于DAG划分Stage，将每个Stage中的任务发到指定节点运行。以词频统计WordCount程序为例，Job执行是DAG图运行词频统计WordCount，截取4040监控页面上DAG图：当RDD调用Action
复制链接

扫一扫

专栏目录