Flink-分布式运行环境

最新推荐文章于 2024-07-24 16:31:12 发布

北京小辉

最新推荐文章于 2024-07-24 16:31:12 发布

阅读量986

点赞数 1

分类专栏：【大数据】Flink1.7.0

【大数据】Flink1.7.0 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

转载请标明出处: https://blog.csdn.net/silentwolfyh

JobManagers (也称为master)协调分布式执行。他们安排任务，协调检查点，协调故障恢复等等。总之至少有一个JobManagers。一个高可用性设置将有多个JobManagers，其中一个总是领导者，其他的都是备用的。
TaskManagers(也称为workers)执行数据流的一个任务(或者更具体地说，多个子任务)，并缓冲和交换数据流。必须始终至少有一个TaskManager。

JobManagers和TaskManagers可以以多种方式启动:直接在机器上作为standalone cluster, 在容器中或由资源框架(如YARN或Mesos)管理。TaskManagers连接到JobManagers，宣布自己可用，并被分配工作。

客户端不是运行时和程序执行的一部分，而是用于准备和向JobManager发送数据流。之后，客户端可以断开连接，或者保持连接以接收进度报告。客户端运行的Java / Scala程序触发执行,或者在命令行过程。

图片说明: 当Flink系统启动时，首先启动JobManager和一至多个TaskManager。JobManager负责协调Flink系统，TaskManager则是执行并行程序的worker。当系统以本地形式启动时，一个JobManager和一个TaskManager会启动在同一个JVM中。当一个程序被提交后，系统会创建一个Client来进行预处理，将程序转变成一个并行数据流的形式，交给JobManager和TaskManager执行。
在这里插入图片描述

3、任务槽和资源

每个worker (TaskManager)都是一个JVM进程，可以在单独的线程中执行一个或多个子任务。为了控制一个worker 接受多少任务，一个worker有一个所谓的任务槽(至少一个)。
每个任务槽表示TaskManager资源的固定子集。例如，一个有三个插槽的TaskManager会将其托管内存的1/3分配给每个插槽。插槽的资源分配意味着子任务不会与其他作业中的子任务竞争内存，而是具有一定数量的保留托管内存。注意，这里没有发生CPU隔离;目前，插槽只分离任务的托管内存。
通过调整任务槽的数量，用户可以定义子任务如何相互隔离。每个TaskManager有一个插槽意味着每个任务组在一个单独的JVM中运行(例如，可以在一个单独的容器中启动)。拥有多个插槽意味着更多的子任务共享同一个JVM。相同JVM中的任务共享TCP连接(通过多路复用)和心跳消息。它们还可以共享数据集和数据结构，从而减少每个任务的开销。
在这里插入图片描述
默认情况下，Flink允许子任务共享插槽，即使它们是不同任务的子任务，只要它们来自同一个任务。结果是一个槽可以容纳整个作业管道。允许这种槽共享有两个主要好处:

Flink集群需要与作业中使用的最高并行度一样多的任务槽。不需要计算程序总共包含多少任务(具有不同的并行度)。
更容易得到更好的资源利用。如果没有槽共享，非密集型源/map()子任务将阻塞与资源密集型窗口子任务一样多的资源。通过插槽共享，将示例中的基本并行度从2提高到6，可以充分利用有槽资源，同时确保繁重的子任务在taskmanager中公平分配。