Flink

最新推荐文章于 2024-08-29 10:45:33 发布

upupfeng

最新推荐文章于 2024-08-29 10:45:33 发布

阅读量181

点赞数

分类专栏： Flink 文章标签： Flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ifenggege/article/details/112122244

版权

Flink 专栏收录该内容

10 篇文章 5 订阅

订阅专栏

文章目录

本文将简单介绍Flink的概念、优点、架构，以及Flink比Spark做的好的地方

什么是Flink？

借官网的一句话。Apache Flink是一个框架和分布式处理引擎，用于在无边界和有边界的数据流上进行有状态的计算。

首先，Flink和Spark一样，都是分布式的计算框架，用来处理大规模数据；其次，用于在无边界和有边界的数据上计算，有无边界起始就是我们常说的批和流，Flink现在在流处理方面所向披靡，在近来的版本中也一直在推流批一体的东西，有一统流批的趋势；最后，有状态的计算，Flink提供了强大的状态支持，能够很便捷的实现很多复杂需求。

Flink优点

事件驱动，支持事件时间
强大的状态支持
精确一次的保证
分层API：DataSet/DataStream、Table/SQL
检查点。Checkpoint、SavePoint
高吞吐，低延迟

分层抽象

在这里插入图片描述

最底层是process api，用户可以最细粒度的对数据进行操作、状态管理等
再上层是DataStream和DataSet，封装了基本的操作算子，可以完成大部分需求。
再上层是Table API，可以将数据集注册为表，进行处理。
最高层是SQL API，基于SQL进行处理。

架构

在这里插入图片描述

https://ci.apache.org/projects/flink/flink-docs-release-1.12/concepts/flink-architecture.html

Flink也是主从架构。客户端提交任务，JobManager负责管理调度，Task Manager负责干活。

Flink比Spark做的好的地方

Flink是真正的流处理，而Spark Streaming是基于微批实现的流。
源码语言。Spark是Scala，Flink是Java，Java用的人还是多点吧。
事件时间的支持。Spark只有批处理时间，Flink提供了ProcessTime、EventTime、IngestTime可选择。
完整的窗口支持。Flink基于状态的加持，在窗口计算这块用起来很舒服。
基于流的SQL处理。流批一体概念的提出可能一统计算框架。

最后

作为Spark的忠粉，每当身边一群不懂Spark的人在狂吹Flink、爆撵Spark时，都很不爽。但是Flink一统流批的趋势是无需争议的，打不过就加入他们。定个小目标，接下来持续输入、输出Flink内容。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。