Apache Flink v1.9(基本概念-术语)

Flink Application Cluster(Flink应用程序集群)

Flink应用程序集群是专用的Flink集群,它仅执行一个独立的Flink作业。Flink集群的生命周期与Flink任务是绑定的。在job模式下,以前的Flink应用程序集群也称为Flink集群。与Flink Session Cluster对应 。

 

Flink Cluster(Flink集群)

一种分布式系统,通常由一个Flink Master和一个或多个 Flink TaskManager进程组成。

 

Event(事件)

事件是有关应用程序建模的域的状态更改声明。事件可以是流或批处理应用程序的输入或输出。事件是特殊类型的记录。

 

ExecutionGraph(执行图)

见物理图

 

Function(函数)

函数由用户实现,并封装Flink程序的应用逻辑。大多数函数由相应的算子包装 。

 

实例

术语实例用于描述运行时特定类型的实例(通常是算子或者函数)。由于Apache Flink主要是用Java编写的,因此它对应于Java中的Instance或Object的定义。在Apache Flink的上下文中,术语“ 并行实例”也经常用来强调相同算子或函数类型的多个实例正在并行运行。

 

Flink作业

Flink作业是Flink程序的运行时表示形式。Flink作业既可以提交到长期运行的Flink会话集群,也可以作为独立的Flink应用程序集群启动。

 

JobGraph(作业图)

请参阅逻辑图

 

Flink JobManager

JobManager是Flink Master中运行的组件之一。JobManager负责监督单个作业的任务执行。历史上,整个Flink Master都称为JobManager。

 

Logical Graph(逻辑图)

逻辑图是描述流处理程序的高级逻辑的有向图。节点是算子,边缘指示输入/输出关系或数据流或数据集。

 

Managed State(受管状态)

受管状态描述了已在框架中注册的应用程序状态。对于受管状态,Apache Flink将特别关注持久化和重新调整。

 

Flink Master(Flink主节点)

Flink Master是一个Flink集群的主节点。它包含三个不同的组件:Flink Resource Manager,Flink调度程序和每个运行Flink Job的JobManager。

 

Operator(算子)

逻辑图的节点。一个算子代表某种操作,通常由函数执行。源和接收器是用于数据摄取和数据出口的特殊算子。

 

Operator Chain(算子链)

一个算子链由两个或多个连续的算子组成,中间没有任何重新分配。同一算子链中的算子无需经过序列化或Flink的网络堆栈即可直接将记录彼此转发。

 

Partition(分区)

分区是整个数据流或数据集的独立子集。通过将每个记录分配给一个或多个分区,将数据流或数据集划分为多个分区。任务在运行时使用数据流或数据集的分区。改变数据流或数据集分区方式的转换通常称为重新分区。

 

Physical Graph( 物理图)

物理图是转换逻辑图以在分布式环境中运行的结果。节点是任务,边缘是指数据流或数据集的输入/输出关系或分区。

 

Record(记录)

记录是数据集或数据流的组成元素。算子和 函数接收记录作为输入,并发出记录作为输出。

 

Flink Session Cluster Flink会话集群

长期运行的Flink集群,它接受多个Flink作业来执行。Flink集群的生命周期不与任何Flink作业绑定。以前,Flink会话群集在会话模式下也称为Flink群集。与Flink应用程序集群对应 。

 

State Backend(不翻译)

对于流处理程序,Flink作业的状态后端确定如何在每个TaskManager(TaskManager的Java堆或(嵌入式)RocksDB)上存储其 状态,以及在检查点上写入状态的位置(Flink Master或文件系统的Java堆) )。

 

Sub-Task(子任务)

子任务是负责处理数据流分区的任务。术语“子任务”强调针对同一算子或算子链有多个并行任务 。

 

Task(任务)

物理图的节点。任务是基本工作单元,由Flink的运行时执行。任务恰好封装了一个算子或算子链的并行实例 。

 

Flink TaskManager(Flink任务管理器)

TaskManager是Flink集群的工作进程。任务被分配给TaskManager执行。它们彼此通信以在后续任务之间交换数据。

 

Transformation(转换)

将转换应用于一个或多个数据流或数据集,并产生一个或多个输出数据流或数据集。转换可能会更改每个记录的数据流或数据集,但也可能仅更改其分区或执行聚合。虽然算子和函数是Flink API的“物理”部分,但转换只是API概念。具体来说,大多数(但不是全部)转换都是由某些算子实现的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值