一、什么是Flink
Apache Flink is a framework and distributed processing engine for stateful computations over unbounded and bounded data streams.
Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行状态计算。
二、那我们为什么选择Flink呢?
1)流数据可以更加真实的反映了我们的生活方式;
2)传统的数据架构是基于有限数据集的;
3)我们的目标是追求低延迟、高吞吐、结果的准确性和良好的容错性;
三、目前哪些行业需要进行流式数据的处理呢?
1)电商和市场营销(数据报表、广告投放、业务流程需要);
2)物联网(IOT)(传感器实时数据采集和显示、实时报警。交通运输业)
3)电信业(基站流量调配)
4)银行和金融业(实时结算和通知推送,实时检测异常行为)
四、传统的数据处理架构
1)事务处理过程