Flink
Flink概述
• Flink是一个批处理和流处理结合的统一计算框架,其核心是一个提供了数据分发以及并行化计算的流数据处理引擎,对无界和有界数据流进行状态计算。
• Flink可以部署在各种资源提供者(如YARN,Apache Mesos和Kubernetes)上,也可以作为裸机硬件上的独立群集。配置为高可用性,Flink没有单点故障,提供高吞吐量和低延迟,并为世界上最苛刻的流处理应用程序提供支持。
• Flink以event为粒度进行计算。
• 有70多个来自学术界和工业界贡献者,从而使得flink项目不断成长。
• 从2014年12月起,成为Apache社区顶级孵化项目。
为什么选择Flink?
• Flink是一个开源的分布式流式处理框架。
• 提供准确的结果,甚至在出现无序或者延迟加载的数据的情况下;
• 它是状态化的容错的,同时在维护一次完整的的应用状态时,能无缝修复错误;
• 大规模运行,在上千个节点运行时有很好的吞吐量和低延迟。
Flink应用场景
• Flink最适合的应用场景是低时延的数据处理场景:高并发处理数据,时延毫秒级,且兼具可靠性。
• 典型应用场景有:
• 欺诈识别
• 异常检测
• 基于规则的警报
• 业务流程监控
• Web应用程序(社交网络)
Fink架构图