-
流(stream)和微批(micro-batching)
flink一切都是流;
Spark Streaming相当于把流处理转换为批处理,spark Streaming 是伪实时处理,处理延迟一定是秒级别的,不能再低了;
所以对于延迟性非常高的场景必须要用Flink。
-
数据模型 :
– spark 采用 RDD 模型,spark streaming 的 DStream 实际上也就是一组 组小批数 据 RDD 的集合;
– flink 基本数据模型是数据流,以及事件(Event)序列。
运行时架构:
– spark 是批计算,将 DAG 划分为不同的 stage,一个完成后才可以计算下一个 ;
– flink 是标准的流执行模式,一个事件在一个节点处理完后可以直接发往下一个节点进行处理。
Flink vs Spark Streaming 对比,区别。
最新推荐文章于 2024-03-09 00:58:49 发布