技术13期：一文读懂Flink的流式处理及窗口理解

最新推荐文章于 2024-09-12 22:10:46 发布

置顶

极客小普冲呀

最新推荐文章于 2024-09-12 22:10:46 发布

阅读量597

点赞数

分类专栏：人工智能技术讨论文章标签：分布式大数据 flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pushiai/article/details/107465368

版权

Apache Flink是分布式大数据处理引擎，擅长处理有界和无界数据流。本文介绍了流处理概念、有界与无界数据流的区别，并详细讲解了Flink中的时间窗口、翻滚窗口、滑动窗口和会话窗口，强调了窗口在无界数据流处理中的重要性。

摘要由CSDN通过智能技术生成

Apache Flink是一个框架和分布式大数据处理引擎，可对有界数据流和无界数据流进行有状态计算。可部署在各种集群环境，对各种大小的数据规模进行快速计算。

Flink基本概念

流处理：特点是无限、实时，无需针对整个数据集执行操作，而是通过对系统传输的每个数据项执行操作，一般用于实时统计。

有界数据流：有明确定义的开始和结束，可以在执行任何计算之前通过获取所有数据来处理有界流，处理有界流不需要有序获取，因为可以始终对有界数据集进行排序，有界流的处理也称为批处理。

无界数据流：有一个开始但是没有结束，它们不会在生成时终止并提供数据，必须连续处理无界流，也就是必须在获取后立即处理event。

处理无界数据通常要求以特定顺序(如事件发生的顺序)获取event，以便能够推断结果完整性。

个人认为，与

最低0.47元/天解锁文章

极客小普冲呀

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。