Flink学习（二）-基础概念

最新推荐文章于 2024-07-25 20:48:29 发布

BatmanWayne

最新推荐文章于 2024-07-25 20:48:29 发布

阅读量619

点赞数 5

分类专栏： flink 文章标签： flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a80C51/article/details/137261862

版权

flink 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

本文详细介绍了流处理中的有界流与无界流概念，Flink程序的基本结构，算子之间的数据传输方式，以及自定义时间流处理和有状态流处理，强调了状态快照在实现容错和精确一次计算中的作用。

摘要由CSDN通过智能技术生成

一、流处理

分为有界流（bounded stream）和无界流（unbounded stream）。

通过上图，可以知道，

有界流：有明显的边界；而无界流，则只有开始，没有结束。

批处理是有界数据流处理的范例。在这种模式下，你可以选择在计算结果输出之前输入整个数据集，这也就意味着你可以对整个数据集的数据进行排序、统计或汇总计算后再输出结果。

流处理正相反，其涉及无界数据流。至少理论上来说，它的数据输入永远不会结束，因此程序必须持续不断地对到达的数据进行处理。

二、Flink 程序基本组成

由 source 开始、经过自定义算子转换（Transformation）成的 dataflow后，以一个或者多个 sink 结束。

三、算子之间数据传输方式

1，一对一（直传）模式

可以保留元素的分区和顺序信息，即同一分区的数据只会进入到下游算子的同一分区。

2，重新分发模式

会更改数据所在的流分区。当你在程序中选择使用不同的 transformation，每个算子子任务也会根据不同的 transformation 将数据发送到不同的目标子任务。

常见的数据分发模式

keyBy()（通过散列键重新分区）；
broadcast()（广播）；
rebalance()（随机重新分发）

四、自定义时间流处理

关注事件本身发生的顺序而不是事件被传输以及处理的顺序；

记录在数据流中的事件时间的时间戳，而不是处理数据的机器时钟的时间戳。

五，有状态流处理

意味着如何处理一个事件可能取决于该事件之前所有事件数据的累积结果。有状态算子的并行实例组在存储其对应状态时通常是按照键（key）进行分片存储的。每个并行实例算子负责处理一组特定键的事件数据，并且这组键对应的状态会保存在本地。

六，通过状态快照实现的容错

通过状态快照和流重放两种方式的组合，Flink 能够提供可容错的，精确一次计算的语义。这些状态快照在执行时会获取并存储分布式 pipeline 中整体的状态，它会将数据源中消费数据的偏移量记录下来，并将整个 job graph 中算子获取到该数据（记录的偏移量对应的数据）时的状态记录并存储下来。当发生故障时，Flink 作业会恢复上次存储的状态，重置数据源从状态中记录的上次消费的偏移量开始重新进行消费处理。而且状态快照在执行时会异步获取状态并存储，并不会阻塞正在进行的数据处理逻辑。

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Flink学习（二）-基础概念

关注事件本身发生的顺序而不是事件被传输以及处理的顺序；记录在数据流中的事件时间的时间戳，而不是处理数据的机器时钟的时间戳。
复制链接

扫一扫

专栏目录

BatmanWayne CSDN认证博客专家 CSDN认证企业博客

码龄13年

154: 原创

6万+: 周排名

2万+: 总排名

22万+: 访问

: 等级

2399: 积分

92: 粉丝

133: 获赞

27: 评论

262: 收藏

私信

关注

热门文章

分类专栏

k8s 10篇
flink 8篇
docker 15篇
数据仓库 12篇
spring cloud 13篇
etl 4篇
rabbitMQ 8篇
ELK 13篇
代码管理
kefka 1篇
mongodb 1篇
postman 1篇
Java语言相关 51篇
sql 11篇
Tensorflow相关 3篇
redis 6篇
python 1篇
算法 18篇
maven 1篇
压缩文件 1篇
fastjson 1篇
liunx 4篇

最新评论

Flink学习（九）-jar 包提交给 flink 集群执行
普通网友: 这篇文章真是一篇佳作!作者运用了生动有趣的语言,将枯燥的理论知识娓娓道来,让人如沐春风。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Flink学习（八）-Flink 集群搭建
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Flink学习（九）-jar 包提交给 flink 集群执行
普通网友: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Flink学习（七）-单词统计
普通网友: 引领技术潮流，是不可多得的好文，十分值得借鉴和参考。期待博主未来能够持续分享更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Flink学习（八）-Flink 集群搭建
普通网友: 文章结构严谨有条,层次分明,读起来一点也不费劲，让人受益匪浅。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。