文章目录
- 1.What is Flink?
- 2. The Feature of Flink?
- 3.Flink整体架构
- 4. Flink分层架构
- 5. 数据集和数据流(DataSet and DataStream )
- 6. 并行的数据流
- 7.支持的数据类型(Supported Data Type)
- 8. Flink构建的流程
- 9. window
- 10. Time类型
- 11. Stateful Operations 状态
- 12. 容错的Checkpoint
- 13. 保存点(Savepoints)
- 14 Barrier概念
- 14.Flink运行时架构
- 14.2 OperatorChain和Task
- 15. Flink On Yarn
- 16 配置
- 17 YarnSession启动命令
- 18 应用启动命令
- 19 累加器和计数器
- 20 Flink 反压
- 参考:
1.What is Flink?
Apache Flink是一个开源的分布式、高性能、高可用、准确
的流处理框架
,主要由Java代码实现,支持实时流(stream)
处理和批(batch)
处理,批数据只是流数据的一个极限的特例。原生支持了迭代管理、内存计算和程序优化。
2. The Feature of Flink?
流式优先(streaming-first:连续处理),容错(fault-tolerant:有状态的计算),可伸缩(scalable:可支持上千个节点),性能(performance:高吞吐-每秒处理的数据量很大、低延迟-数据产生时Flink立刻可以处理掉 数据的产生到处理间隔的时间很短)。