Flink02-Flink运行架构第一节-运行时的组件和基本原理

最新推荐文章于 2023-02-08 19:57:44 发布

程序员大魔王

最新推荐文章于 2023-02-08 19:57:44 发布

阅读量250

点赞数

分类专栏： Flink 大数据学习文章标签： flink 大数据分布式

本文链接：https://blog.csdn.net/sinat_35667067/article/details/105662665

版权

大数据学习同时被 2 个专栏收录

15 篇文章 1 订阅

订阅专栏

Flink

4 篇文章 0 订阅

订阅专栏

由于本章节内容比较多,防止学习枯燥,分成了4节来写(点击标题可跳转, 持续更新ing)
1-运行时的组件和基本原理
 2-Slot和并行度
3-数据流和执行图
4-任务调度控制

文章目录

1-Flink运行时的组件

运行时组件

1）作业管理器（JobManager）

JobManager

2）任务管理器（TaskManager）

任务管理器

3）资源管理器（ResourceManager）

资源管理器

4）分发器（Dispatcher）

在这里插入图片描述

2-任务提交流程

任务提交流程
上图是从一个较为高层级的视角，来看应用中各组件的交互协作。如果部署的集群环境不同（例如 YARN，Mesos，Kubernetes，standalone 等），其中一些步骤可以被省略，或是有些组件会运行在同一个 JVM 进程中。

具体地，如果我们将 Flink 集群部署到YARN 上，那么就会有如下的提交流程：
任务提交流程yarn

Flink 任务提交后，Client 向 HDFS 上传 Flink 的 Jar 包和配置
向 Yarn ResourceManager 提交任务
ResourceManager 分配 Container 资源并通知对应的NodeManager 启动 ApplicationMaster，ApplicationMaster 启动后加载 Flink 的 Jar 包和配置构建环境，然后启动 JobManager
ApplicationMaster 向 ResourceManager申请资源启动 TaskManager ， ResourceManager 分配 Container 资源后
ApplicationMaster 通知资源所在节点的 NodeManager 启动 TaskManager ， NodeManager 加载 Flink 的 Jar 包和配置构建环境并启动 TaskManager，TaskManager启动后向 JobManager 发送心跳包，并等待 JobManager 向其分配任务。

3-任务调度原理

任务调度原理

客户端不是运行时和程序执行的一部分，但它用于准备并发送dataflow(JobGraph)给 Master(JobManager)，然后，客户端断开连接或者维持连接以等待接收计算结果。

当 Flink 集群启动后，首先会启动一个 JobManger 和一个或多个的 TaskManager。由 Client 提交任务给 JobManager，JobManager 再调度任务到各个 TaskManager 去执行，然后 TaskManager 将心跳和统计信息汇报给 JobManager。 TaskManager 之间以流的形式进行数据的传输。上述三者均为独立的 JVM 进程。

Client 为提交 Job 的客户端，可以是运行在任何机器上（与 JobManager 环境连通即可）。提交 Job 后，Client 可以结束进程（Streaming 的任务），也可以不结束并等待结果返回。

JobManager 主要负责调度 Job 并协调 Task 做 checkpoint ，职责上很像 Storm 的 Nimbus。从 Client 处接收到 Job 和 JAR 包等资源后，会生成优化后的执行计划，并以 Task 的单元调度到各个 TaskManager 去执行。

TaskManager 在启动的时候就设置好了槽位数（Slot），每个 slot 能启动一个 Task，Task 为线程。从 JobManager 处接收需要部署的 Task，部署启动后，与自己的上游建立 Netty 连接，接收数据并处理。

程序员大魔王

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Flink02-Flink运行架构第一节-运行时的组件和基本原理

文章目录1-Flink运行时的组件1）作业管理器（JobManager）2）任务管理器（TaskManager）3）资源管理器（ResourceManager）4）分发器（Dispatcher）2-任务提交流程3-任务调度原理1-Flink运行时的组件1）作业管理器（JobManager）2）任务管理器（TaskManager）3）资源管理器（ResourceManager）4）...
复制链接

扫一扫