- Flink应用程序集群:专门的Flink集群,它仅执行一个Flink作业。生命周期与该作业相同。在工作模式下,以前的Flink应用程序集群也称为Flink集群。
- Flink集群:一种分布式系统,通常由一个Flink Master和一个或多个Flink TaskManager进程组成。
- 事件:有关由应用程序建模的域的状态更改的声明。事件可以是流或批处理应用程序的输入或输出。事件是特殊类型的记录。
- 执行图:见16:物理图
- 功能:功能由用户实现,并封装Flink程序的应用程序逻辑。大多数功能由相应的运算符包装。
- 实例:术语“实例”用于描述特定类型的【通常是操作或功能】。由于Flink主要是用Java编写的,因此它对应于Java中的Instance或Object的定义。在Flink上下文中,术语“并行实例”也经常用来强调相同操作符或函数类型的多个实例正在并行运行。
- Flink Job:Flink作业时Flink程序的运行时表示形式。Flink作业既可以提交到长期运行的Flink会话集群,也可以作为独立的Flink应用程序集群启动。
- 作业图:参考10:逻辑图
- Flink JobManager:JobManager是Flink Master中运行的组件之一。JobManager负责监督单个作业的任务执行。历史上,整个Flink Master都称为JobManager。
- 逻辑图:描述流处理程序的高级逻辑的有向图。节点是运算符,边指示运算符的输入/输出关系,并且对应于数据流或数据集。
- 受管状态:描述了已在框架中注册的应用程序状态。对于受管状态,Flink将特别关注持久性和重新缩放。
- Flink Master:Flink集群的主节点。它包含三个不同的组件:Flink资源管理器、Flink调度程序和Flink JobManager。
- Operator:逻辑图的节点。执行某种操作,通常由Function执行。源和接收器是用于数据摄取和数据输出的特殊运算符。
- 操作链:一个操作链由两个或多个连续的操作组成。中间没有任何重新分配。同一操作链中的操作无需经过序列化或Flink的网络堆栈即可直接将记录彼此转发。
- 划分:分区是整个数据流或数据集的独立子集。通过将每个记录分配给一个或多个分区,将数据流或数据集划分为多个分区。任务在运行时使用数据流或数据集的分区。改变数据流或数据集分区方式的转换通常称为重新分区。
- 物理图:物理图是转换逻辑图以在分布式运行时中执行的结果。节点是任务,边指示数据流或数据集的输入/输出关系或分区。
- 记录:数据集或数据流的组成元素。运算符和函数接收记录作为输入,并发出记录作为输出。
- Flink会话集群:长期运行的Flink集群,它接受多个Flink作业来执行。此Flink集群的生存期未绑定到任何Flink作业的生存期。以前,Flink会话集群在会话模式下也称为Flink集群。
- 状态后端:对于流处理程序,Flink作业的状态后端确定如何在每个TaskManager【TaskManager的Java堆或嵌入式的RocksDB】上存储其状态,以及如何在检查点上写入状态。
- 子任务:子任务是负责处理数据流分区的任务。术语“子任务”强调针对同一操作或操作链有多个并行任务。
- 任务:物理图的节点。任务是基本工作单元,由Flink的运行时执行。任务恰好封装了一个操作或操作链的并行实例。
- Flink任务管理器:TaskManager是Flink集群的工作进程。任务安排在TaskManager中执行。它们彼此通信以在后续任务之间交换数据。
- 转换:将转换应用于一个或多个数据流或数据集,并产生一个或多个输出数据流或数据集。转换可能会更改每个记录的数据流或数据集,但也可能仅更改其分区或执行聚合。尽管运算符和函数是Flink API的物理部分,但转换只是API概念。具体而言,大多数转换是由某些操作实现的。
Flink词汇表【常用词汇集锦】
最新推荐文章于 2023-10-12 08:12:01 发布