Flink词汇表【常用词汇集锦】

41 篇文章 1 订阅
28 篇文章 2 订阅
  1. Flink应用程序集群:专门的Flink集群,它仅执行一个Flink作业。生命周期与该作业相同。在工作模式下,以前的Flink应用程序集群也称为Flink集群。
  2. Flink集群:一种分布式系统,通常由一个Flink Master和一个或多个Flink TaskManager进程组成。
  3. 事件:有关由应用程序建模的域的状态更改的声明。事件可以是流或批处理应用程序的输入或输出。事件是特殊类型的记录。
  4. 执行图:见16:物理图
  5. 功能:功能由用户实现,并封装Flink程序的应用程序逻辑。大多数功能由相应的运算符包装。
  6. 实例:术语“实例”用于描述特定类型的【通常是操作或功能】。由于Flink主要是用Java编写的,因此它对应于Java中的Instance或Object的定义。在Flink上下文中,术语“并行实例”也经常用来强调相同操作符或函数类型的多个实例正在并行运行。
  7. Flink Job:Flink作业时Flink程序的运行时表示形式。Flink作业既可以提交到长期运行的Flink会话集群,也可以作为独立的Flink应用程序集群启动。
  8. 作业图:参考10:逻辑图
  9. Flink JobManager:JobManager是Flink Master中运行的组件之一。JobManager负责监督单个作业的任务执行。历史上,整个Flink Master都称为JobManager。
  10. 逻辑图:描述流处理程序的高级逻辑的有向图。节点是运算符,边指示运算符的输入/输出关系,并且对应于数据流或数据集。
  11. 受管状态:描述了已在框架中注册的应用程序状态。对于受管状态,Flink将特别关注持久性和重新缩放。
  12. Flink Master:Flink集群的主节点。它包含三个不同的组件:Flink资源管理器、Flink调度程序和Flink JobManager。
  13. Operator:逻辑图的节点。执行某种操作,通常由Function执行。源和接收器是用于数据摄取和数据输出的特殊运算符。
  14. 操作链:一个操作链由两个或多个连续的操作组成。中间没有任何重新分配。同一操作链中的操作无需经过序列化或Flink的网络堆栈即可直接将记录彼此转发。
  15. 划分:分区是整个数据流或数据集的独立子集。通过将每个记录分配给一个或多个分区,将数据流或数据集划分为多个分区。任务在运行时使用数据流或数据集的分区。改变数据流或数据集分区方式的转换通常称为重新分区。
  16. 物理图:物理图是转换逻辑图以在分布式运行时中执行的结果。节点是任务,边指示数据流或数据集的输入/输出关系或分区。
  17. 记录:数据集或数据流的组成元素。运算符和函数接收记录作为输入,并发出记录作为输出。
  18. Flink会话集群:长期运行的Flink集群,它接受多个Flink作业来执行。此Flink集群的生存期未绑定到任何Flink作业的生存期。以前,Flink会话集群在会话模式下也称为Flink集群。
  19. 状态后端:对于流处理程序,Flink作业的状态后端确定如何在每个TaskManager【TaskManager的Java堆或嵌入式的RocksDB】上存储其状态,以及如何在检查点上写入状态。
  20. 子任务:子任务是负责处理数据流分区的任务。术语“子任务”强调针对同一操作或操作链有多个并行任务。
  21. 任务:物理图的节点。任务是基本工作单元,由Flink的运行时执行。任务恰好封装了一个操作或操作链的并行实例。
  22. Flink任务管理器:TaskManager是Flink集群的工作进程。任务安排在TaskManager中执行。它们彼此通信以在后续任务之间交换数据。
  23. 转换:将转换应用于一个或多个数据流或数据集,并产生一个或多个输出数据流或数据集。转换可能会更改每个记录的数据流或数据集,但也可能仅更改其分区或执行聚合。尽管运算符和函数是Flink API的物理部分,但转换只是API概念。具体而言,大多数转换是由某些操作实现的。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值