Flink 和 Spark Streaming 的对比

最新推荐文章于 2024-07-13 10:06:08 发布

马本不想再等了

最新推荐文章于 2024-07-13 10:06:08 发布

阅读量416

点赞数

文章标签： flink spark

本文链接：https://blog.csdn.net/qq_42180284/article/details/103945631

版权

Spark Streaming

数据模型Dstream，其实是一个RDD集合，批处理。
运行时，根据DAG划分Stage，生成taskSet，根据资源调度task。
角色Master和Worker。Driver 负责调度Task，Executor负责执行 Task。
支持处理时间，Structrued Streaming 支持处理事件时间，有watermark，支持处理乱序时间
状态的保存使用checkpoint，但是会产生很多小文件。要借助外部存储时，会频繁交互。
手动维护offset可以实现Exectly-one
与kafka0.8不支持检测新增分区，与kafka0.10支持检测新增分区。

Flink

数据流（事件序列），事件触发计算更状态，真正的流处理
运行时，StreamGraph，JobGraph，ExecutionGraph，生成固定的拓扑结构图，最后交给JobManager执行。
JobManager和TaskManager，TaskManager上的Solt数代表着TaskMnager的并行度。
支持处理时间，事件时间，注入时间（数据进入flink的时间），有watermark，支持处理乱序时间
使用fsStateBackend （HDFS上）和 RocketsDBStateBackend（本地）保存状态。
与kafka 0.11 配合使用可以实现 Exectly-one
FlinkKafkaConsumerBase 的run方法里，创建了一个线程定期检测kafka新增分区。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

马本不想再等了

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Flink和Spark Streaming流式计算模型比较分析

weixin_43520450的博客

05-31

1957

流式计算模型比较分析一、Spark Streaming1.1 Spark概述1.2 Spark Streaming 概述二、Flink2.1 Flink 概述2.2 Flink的基本架构三、Flink和Spark Streaming流式计算对比分析3.1 时间机制3.2 容错机制和一致性语义四、分析总结一、Spark Streaming 1.1 Spark概述 Spark是UC Berkeley AMP Lab开源的类似于MapReduce的通用的并行计算框架，同时兼顾分布式的并行计算模型和基于内存计算的

实时大数据流处理技术：Spark Streaming与Flink的深度对比

升仔聊编程的博客

03-09

1192

Flink在流处理、状态管理和低延迟方面表现更优，而Spark Streaming在批处理和微批处理场景、以及成熟的生态系统支持方面有其独到之处。由于Flink的设计更加注重流处理，它能够为需要高吞吐量和低延迟的应用提供更优的支持。由于其广泛的社区支持和成熟的生态系统，提供了大量的库和API，使得开发者能够相对容易地实现复杂的大数据处理任务。都提供了强大的机制。Spark Streaming通过微批处理模型简化了容错处理，而Flink提供了精细的检查点机制来保证状态的一致性和恢复。在容错和数据一致性方面，

参与评论您还未登录，请先登录后发表或查看评论

Flink，Storm，Spark Streaming三种流框架的对比分析

06-24

Flink，Storm，Spark Streaming三种流框架的对比分析。比较清晰明确

Flink——flink和sparkStreaming 对比？

Aying_seeyou的博客

07-14

1459

批处理（批量）_sparkStreaming 处理完成一条数据后，将其序列化到缓存中，当缓存写满时，就持久化到本地硬盘上；在所有数据都被处理完成后，才开始将其通过网络传输到下一个节点适合有边界数据使用DataSet 要求高吞吐流处理（逐个）_flink 在处理完成一条数据后，将其序列化到缓存中，并立刻通过网络传输到下一个节点，由下一个节点继续处理。适合无边界数据使用DataStream 要求低延迟批处理和流处理（DataSet和DataStream）最大的区别在于对时间的处理。另外

【图解大数据技术】流式计算：Spark Streaming、Flink

最新发布

weixin_43889578的博客

07-13

1260

Flink 和 Spark Streaming 不一样，Flink 一开始设计就是为了做实时流式计算的。它可以监听消息队列获取数据流，也可以用于计算存储在 HDFS 等存储系统上的数据（Flink 把这些静态数据当做数据流来进行处理）。然后 Flink 计算后生成的结果流，也可以发送到其他存储系统。

干货 | Spark Streaming 和 Flink 详细对比

super_wj0820的博客

09-18

413

此文不错參考：https://blog.csdn.net/b6ecl1k7BS8O/article/details/81350587

Flink-初识(特点、与sparkstreaming的比较)

qq_38304392的博客

05-18

241

1.初识 Flink 起源于 Stratosphere 项目，Stratosphere 是在 2010~2014 年由 3 所地处柏林的大学和欧洲的一些其他的大学共同进行的研究项目，2014 年 4 月 Stratosphere 的代码被复制并捐赠给了 Apache 软件基金会，参加这个孵化项目的初始成员是Stratosphere 系统的...

flink和spark streaming对比

03-16

Flink和Spark Streaming是两种流处理框架。 Flink具有高效的数据处理能力和实时性，并且支持多种数据源和数据格式，同时具有灵活的窗口操作和聚合功能。 Spark Streaming则以其与Spark生态系统的紧密集成和易用性...

flink,spark streaming,storm框架对比

03-26

flink,spark streaming,storm框架对比，

Flink 相比传统的 Spark Streaming 区别?

857技术社区

06-01

903

这个问题是一个非常宏观的问题，因为两个框架的不同点非常之多。但是在面试时有非常重要的一点一定要回答出来：Flink 是标准的实时处理引擎，基于事件驱动。而 Spark Streaming 是微批（Micro-Batch）的模型。下面我们就分几个方面介绍两个框架的主要区别：架构模型：Spark Streaming 在运行时的主要角色包括：Master、Worker、Driver、Executor， Flink 在运行时主要包:Jobmanager、Taskmanager 和 Slot。任务

Spark Streaming 和 Flink 详细对比

zll_1234的博客

05-27

326

干货 | Spark Streaming 和 Flink 详细对比原文详见：https://mp.weixin.qq.com/s/Fb1cW0oN7xYeb1oI2ixtgQ

flink教程：Flink 和 Spark Streaming的区别？

学亮编程手记

08-30

607

1. 架构模型Spark Streaming 在运行时的主要角色包括：服务架构集群和资源管理 Master Yarn Application Master；工作节点 Work Node Manager；任务调度器 Driver；任务执行器 ExecutorFlink 在运行时主要包含：客户端 Client、作业管理 Jobmanager、任务管理Taskmanager。2. 任务调度。

SparkStreaming和Flink关键区别

wjy1208的专栏

09-28

2493

SparkStreaming 和 Flink 区别 different

【Spark系列】：多方面综合对比Spark Streaming和Flink

hxcaifly的博客

01-06

1644

前言本文从编程模型、任务调度、时间机制、Kafka 动态分区的感知、容错及处理语义、背压等几个方面对比 Spark Stream 与 Flink，希望对有实时处理需求业务的企业端用户在框架选型有所启发。 1. 基本概念对比 1.1. 运行角色 Spark Streaming 运行时的角色(standalone 模式)主要有： Master:主要负责整体集群资源的管理和应用程序调度； Work...

Flink替代Spark Streaming怎么样？本篇给你答案

Dinosaur_1117的博客

04-19

1179

作者介绍孙赵宏，2018年4月加入去哪儿网，后端大数据研发工程师，目前在大住宿事业部/公共技术中心负责用户基础行为数据工程的研发。本文会主要介绍下基于 Flink 构建用户实时基础行为工程的相关实践，包括 Flink 相关的技术点和基础行为实时工程的业务。 Flink 是目前 Qunar 主推的实时数据处理开源平台，用于替代 Spark Streaming。如果你们使用 Flink 也是和我...

【Flink】Flink中的Checkpoint和Spark中的Checkpoint区别

qq_43744420的博客

08-16

1870

Flink中的Checkpoint和Spark中的Checkpoint区别

Flink vs Spark Streaming 对比，区别。

lkm0522的博客

11-02

1912

流（stream）和微批（micro-batching） flink一切都是流； Spark Streaming相当于把流处理转换为批处理，spark Streaming 是伪实时处理，处理延迟一定是秒级别的，不能再低了；所以对于延迟性非常高的场景必须要用Flink。数据模型： – spark 采用 RDD 模型，spark streaming 的 DStream 实际上也就是一组组小批数据 RDD 的集合； – flink 基本数据模型是数据流，以及事件（Event）序列。运行时架..

Apache Flink现在在大数据处理方面

tao_wei162的博客

09-29

711

我们是否还需要另外一个新的数据处理引擎？当我第一次听到flink的时候这是我是非常怀疑的。在大数据领域，现在已经不缺少数据处理框架了，但是没有一个框架能够完全满足不同的处理需求。自从Apache spark出现后，貌似已经成为当今把大部分的问题解决得最好的框架了，所以我对另外一款解决类似问题的框架持有很强烈的怀疑态度。不过因为好奇，我花费了数个星期在尝试了解flink。一开始仔细看了flink...