原文链接: Flink–(一、初识Flink).
Flink 是什么
Apache Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行状态计算。
Flink 的全球热度与为什么选择 Flink
- 流数据更真实地反映了我们的生活方式
- 传统的数据架构是基于有限数据集的
- 目标
Ø 低延迟
Ø 高吞吐
Ø 结果的准确性和良好的容错性
哪些行业需要处理流数据
- 电商和市场营销
Ø 数据报表、广告投放、业务流程需要 - 物联网(IOT)
Ø 传感器实时数据采集和显示、实时报警,交通运输业 - 电信业
Ø 基站流量调配 - 银行和金融业
Ø 实时结算和通知推送,实时检测异常行为
总结来说,就是会产生有界或者无界的数据,并需要对相应数据进行处理的行业
传统数据处理架构
- 事务处理
- 分析处理
- 有状态的流式处理
流处理的演变
- lambda 架构
Ø 用两套系统,同时保证低延迟和结果准确
- spark