【Flink学习笔记】(一)Flink的入门介绍
最近开始学习Flink框架了,因此开个专栏将学习中的笔记记录一下。第一篇为Flink的入门介绍,主要以理论知识为主,不涉及代码层面的内容。菜鸟第一次接触Flink,有问题的话欢迎各位大佬批评指正。
1 Flink是什么
官方介绍:Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行状态计算
Flink的logo是一只小松鼠 ,在德语中,Flink的意思是快速、灵巧
目前,Flink框架在实际应用中涵盖了诸多应用场景,国内一线大厂很多都使用Flink应用到生产环境中。例如:
- 电商和市场营销:数据报表、广告投放
- 物联网
- 电信业
- 银行和金融业
2 Why Flink?
- 流数据更真实:真实的生产环境中“数据”是源源不断的,往往以数据流的形式呈现出来
- 传统数据架构是基于有限数据集的:传统的数据架构下,在实际的处理流程中,流数据被“攒”成一批批数据集来处理,因此需要一定的时间来等待。这样一来就和现实中真实的数据情况存在差别了,并不是实际意义上的实时
- 数据处理的终极目标:低延迟、