Flink是什么
Apache Flink 的前身是柏林理工大学一个研究性项目 Software Foundation, 在 2014 被 Apache 孵化器所接受,2015年更名为Flink并成为了Apache的顶级项目之一。
Flink在德语的意思中是灵巧,敏捷的意思,所以Flink的logo是个松鼠。
在Flink官网中对Flink的定义为:Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行状态计算。
Flink的特点
-
事件驱动
-
基于流的时间观
在Flink的时间观中,一切都是流组成的,离线数据是有界的流,实时数据是没有界限的流。
-
分层API
越顶层越抽象,表达含义越简明,使用越方便
越底层越具体,表达能力越丰富,使用越灵活
-
支持事件时间和处理时间
-
精确一次的状态一致性保证
-
低延迟,每秒处理数百万个事件,毫秒级延迟
-
与总多常用存储系统的连接
-
高可用,动态扩展,实现全天候运行
Flink or Spark Streaming
Flink是流处理
Spark Streaming是微批处理