文章目录
Flink概述
1、什么是Flink?
1.Apache Flink是一个面向分布式数据流处理和批量数据处理的开源计算平台,提供支持流处理(处理实时数据)和批处理(处理批量数据)两种类型应用的功能
2.Apache Flink 的前身是柏林理工大学一个研究性项目, 在 2014 被 Apache 孵化器所接受,然后迅速地成为了Apache Software Foundation的顶级项目之一
3.代码主要由Java实现,部分代码是Scala
4.Flink主要处理的场景就是流数据,批处理只是流数据的一个极限特例
2、数据类型
有界流(bounded stream)批量数据
有界流通常被称为有界数据集,数据的特点为有限不会改变的数据集合
无界流(unbounded stream) 实时数据
无界流通常被称为无穷数据集,数据的特点为无穷集成的数据集合
有界流与无界流对比
3、数据运算模型
流式计算
只要数据一直在产生,计算就持续的进行 处理无界数据集
批处理
在预定义的时间内运行计算,当计算完成时释放计算机资源 处理有界数据集
Flink部署方式
------未完