flink 什么是fink（一）flink架构

最新推荐文章于 2024-05-06 10:37:34 发布

666呀

最新推荐文章于 2024-05-06 10:37:34 发布

阅读量659

点赞数

分类专栏： flink 文章标签： flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Suubyy/article/details/119739092

版权

flink 专栏收录该内容

19 篇文章 1 订阅

订阅专栏

文章目录

flink架构

flink架构

flink是一个框架和分布式处理引擎，它被用于对无界和有界数据流进行有状态计算。flink被设计成可以运行在所有常见的集群环境中，并以内存速度和任何规模执行计算。

处理无界流和有界流

任何种类的数据都是作为事件流产生的。

数据可以作为无界流和有界流进行出来。

无界流：无界流是一个又开始但是没有定义结束的数据流。无界流必须实时的处理，不可能等待所有数据到达后再处理，这是不可能的，因为无界流是无限的，任何时候都不会结束。处理无界流需要按照特定的顺序接收事件，例如事件发生的顺序，以便能够对结果的完整性进行推理。
有界流：有界流定义了开始和结束。有界流可以在执行任何计算之前获取所有的待计算的数据。处理有界流不需要有序的输入，因为有界流数据总是可以排序的，有界流的处理也成为批处理。

**flink 擅长处理无界和有界数据集。**对时间和状态的精确控制使flink运行时能够在无界流上运行任何类型的应用程序。对于有界流，flink内部有专门的算法和数据结构进行处理，具有卓越的性能。

随处部署应用程序

flink是一个分布式系统，需要系统资源才能执行应用程序。flink能够集成所有通用的资源管理器，例如hadoop yarn、apache mesos、kubernetes，而且也可以独立部署。

Flink被设计成能够很好地工作于前面列出的每个资源管理器。这是通过特定于资源管理器的部署模式实现的，这种部署模式允许Flink以其惯用的方式与每个资源管理器交互。

当部署flink应用程序的时候，flink会根据应用程序配置的并行度自动计算所需要的计算资源，并从资源管理其中申请所需要的资源。如果发生故障，flink会通过重新请求资源来替换失败的Container。提交或者控制应用程序的所有通信都是通过REST调用进行的。这简化了flink在许多环境中的集成。

以任何规模运行应用程序

Flink被设计为在任何规模上运行有状态流的应用程序。应用程序被并行地分成数千个任务，这些任务分布在一个集群中并并发地执行。因此，应用程序可以几乎不受限制的使用cpu、主内存、磁盘和网络IO。而且，Flink可以轻松维护非常大的应用程序状态。它的异步和增量检查点算法确保了对处理延迟的最小影响，同时保证了精确一次的状态一致性。

用户报告了在其生产环境中运行的 Flink 应用程序的可扩展性数字令人印象深刻，例如

每天处理数万亿个事件的应用程序，
维护数 TB 状态的应用程序，以及
在数千个内核上运行的应用程序。

利用内存性能

有状态 Flink 应用程序针对本地状态访问进行了优化。任务状态始终保存在内存中，或者如果状态大小超过可用内存，则保存在访问高效的磁盘数据结构中。因此，任务通过访问本地的、通常在内存中的状态来执行所有计算，从而产生非常低的处理延迟。Flink 通过定期和异步地将本地状态检查点持久到存储介质中来保证在发生故障时的一次性状态一致性。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
flink 什么是fink（一）flink架构

文章目录flink架构处理无界流和有界流随处部署应用程序以任何规模运行应用程序利用内存性能flink架构flink是一个框架和分布式处理引擎，它被用于对无界和有界数据流进行有状态计算。flink被设计成可以运行在所有常见的集群环境中，并以内存速度和任何规模执行计算。处理无界流和有界流任何种类的数据都是作为事件流产生的。数据可以作为无界流和有界流进行出来。无界流：无界流是一个又开始但是没有定义结束的数据流。无界流必须实时的处理，不可能等待所有数据到达后再处理，这是不可能的，因为无界流是无限的，任
复制链接

扫一扫

专栏目录

666呀 CSDN认证博客专家 CSDN认证企业博客

码龄7年

181: 原创

5万+: 周排名

165万+: 总排名

26万+: 访问

: 等级

3958: 积分

104: 粉丝

101: 获赞

68: 评论

252: 收藏

私信

关注

热门文章

分类专栏

多线程 1篇
flink 19篇
数仓 3篇
IO 1篇
Redis 3篇
分布式 1篇
大数据专栏（一）Spark 27篇
s3 1篇
编程语言专栏（一）Scala 11篇
算法 5篇
spring 9篇
zookeeper 1篇
mysql 14篇
linux 3篇
scala 10篇
quartz 2篇
spark 31篇
hbase 2篇
hadoop 1篇
hive 1篇
Java设计模式 1篇
ambari 3篇
springmvc 1篇
vspere 1篇
elasticsearch 39篇
springboot 3篇
kafka 2篇

最新评论

Redisson分布式锁-源码分析
水中加点糖: 整体流程图不太对，没有设备锁过期时间也会有看门狗定时续期的。
CacheManager设置Jackson2JsonRedisSerializer的时候不生效问题
666呀: config.serializeKeysWith这行代码是创建了一个新的RedisCacheConfiguration ，也就是说config.serializeKeysWith这行代码并没有给最上边自己创建的RedisCacheConfiguration 设置serializeKeysWith这属性。所以才不会生效，只有用返回的新RedisCacheConfiguration 才会生效
CacheManager设置Jackson2JsonRedisSerializer的时候不生效问题
csdnzhw: RedisCacheConfiguration config = redisCacheConfiguration(cacheProperties) .serializeKeysWith(RedisSerializationContext.SerializationPair.fromSerializer(redisSerializer)) .serializeValuesWith(RedisSerializationContext.SerializationPair.fromSerializer(jackson2JsonRedisSerializer)) .entryTtl(Duration.ofMinutes(10)); 遇到类似的问题，上面这种写法也能解决。只是不明白为什么要这么搞。。。
Kafka Consumer消费压力测试
恰柠檬的铲车人: 请问楼主，comsumer测试结果中最后4项数据显示很奇怪，该怎么解决呢？数据如下： 2022-05-11 17:55:35:384, 2022-05-11 17:55:38:372, 9.5367, 3.1917, 100000, 33467.2021, 1652262936976, -1652262933988, -0.0000, -0.0001
MySQL8安全指南之一般安全问题
Cdf（人名）: 都是博主辛苦创作，我来支持一下，奥利给,期待大佬回访！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。