Flink概念梳理

最新推荐文章于 2024-07-24 16:31:12 发布

九师兄

最新推荐文章于 2024-07-24 16:31:12 发布

阅读量1.4k

点赞数

分类专栏：大数据-flink

本文为博主九师兄（QQ:541711153 欢迎来探讨技术）原创文章，未经允许博主不允许转载。

本文链接：https://blog.csdn.net/qq_21383435/article/details/85531237

版权

大数据-flink 专栏收录该内容

854 篇文章 856 订阅 ¥99.90 ¥299.90

订阅专栏

Apache Flink是一个开源流处理框架，具有流式优先、容错性、可伸缩性和高性能等特点。其架构分为三层，包括运行时系统、核心实现层和API层。Flink支持DataStream和DataSet API，提供数据流的并行处理，支持多种数据类型，包括Tuple、Case Class、POJO等。Flink通过Checkpoint和Savepoint实现容错，并利用Barrier进行分布式快照，确保一致性的状态更新。此外，Flink支持时间窗口和事件时间处理，以及有状态操作。在运行时，Flink使用Task Slot进行任务并行，通过OperatorChain优化性能。

摘要由CSDN通过智能技术生成

文章目录

1.What is Flink？
2. The Feature of Flink？
3.Flink整体架构
4. Flink分层架构
5. 数据集和数据流(DataSet and DataStream )
6. 并行的数据流
7.支持的数据类型(Supported Data Type)
- 7.1 Tuple和Case Class
- 7.2 POJO
- 7.3 原生数据类型
- 7.4 常规类类型
- 7.5 值类型
- 7.6 Hadoop的Writable类
- 7.7 特殊类型
8. Flink构建的流程
9. window
10. Time类型
11. Stateful Operations 状态
12. 容错的Checkpoint
- 12.1 基本原理
13. 保存点（Savepoints）
14 Barrier概念
14.Flink运行时架构
- 14.1 槽位（Task Slot）和资源
- - 14.1.1 槽位（Task Slot）分配方法
14.2 OperatorChain和Task
- 14.3 Source
- 14.4 Transformation
- 14.5 2.5 Sink
15. Flink On Yarn
- 15.1 Flink job的启动方式
- 15.2 job的启动过程
- 15.3 HA服务
16 配置
17 YarnSession启动命令
18 应用启动命令
19 累加器和计数器
- 19.1 如何使用累加器:
- 19.2 自定义累加器
20 Flink 反压
参考：

在这里插入图片描述

1.What is Flink？

Apache Flink是一个开源的分布式、高性能、高可用、准确的流处理框架，主要由Java代码实现，支持实时流(stream)处理和批(batch)处理，批数据只是流数据的一个极限的特例。原生支持了迭代管理、内存计算和程序优化。

2. The Feature of Flink？

流式优先(streaming-first：连续处理)，容错(fault-tolerant：有状态的计算)，可伸缩(scalable：可支持上千个节点)，性能(performance：高吞吐-每秒处理的数据量很大、低延迟-数据产生时Flink立刻可以处理掉数据的产生到处理间隔的时间很短)。

3.Flink整体架构

了解本专栏

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

九师兄 你的鼓励是我做大写作的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。