Flink学习系列——Flink简介（一）

恒生LIGHT云社区

于 2021-06-22 13:42:00 发布

阅读量556

点赞数

文章标签：分布式大数据 flink python java

本文链接：https://blog.csdn.net/weixin_44433834/article/details/122620103

版权

本文介绍了Flink作为实时流处理框架的特点和优势，对比了与SparkStreaming的区别。Flink适用于电商、物联网、电信和金融等行业，提供低延迟、高吞吐量和精确一次的状态一致性保证。流数据处理能够实时反映业务动态，适合需要快速响应的场景。

摘要由CSDN通过智能技术生成

作者：高二蛋

来源：恒生LIGHT云社区

主要内容:

1.Flink是什么

2.为什么选择 Flink:

3.哪些行业需要处理流数据呢?

4.流式处理的演变:

5.Flink主要特点:

6.flink VS Spark Streaming:

结构:
- Flink:流(stream)
- Spark Streaming:微批(micro-batching)
数据模型:
- Flink:基本数据模型就是数据流,以及事件(Event)序列;
- Spark采用RDD模型,SparkStreaming的DStream实际上也就是一组组小批数据RDD的集合;
运行时架构:
- Flink:是标准的流执行模式,一个事件在一个节点处理完后可以直接发往下一个节点进行处理;(因为没有stage的划分,所以延迟性低)
- Spark是批处理,将DAG划分为不同的stage,一个完成之后才可以计算下一个;