flink简介

最新推荐文章于 2024-07-12 13:44:50 发布

forerunner123

最新推荐文章于 2024-07-12 13:44:50 发布

阅读量153

点赞数

分类专栏： Flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/forerunner123/article/details/114886105

版权

Flink 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

Apache flink是一个框架和分布式处理引擎，用于对无界和有界数据流 进行状态计算。
实时数据处理特性：

低延迟
高吞吐
结果的准确和容错性

来一条处理一条，还是攒一批（一定量、或者一定时间）再处理，同时满足低延迟、高吞吐、容错。

流数据行业：

物联网：传感器实时数据采集
银行金融业
电商、市场营销：数据报表、广告投放
电信

数据处理演变过程：
（1）用户事件+后台处理+存储
传统架构下，在数据量变得过大时，吞吐低，响应慢，甚至数据丢失
在这里插入图片描述
2，离线处理
能够处理大批量数据，但是响应慢

第一代流处理结构
将数据存储在内存，保证低延迟；通过分布式扩容性能，再通过检查点机制保证数据不丢失。但是响应结果数据的有序性不能保证

4.第二代方案
通过lambada结构，使用两套系统，一套用块处理（准实时），保证准确的处理结构，一套实时流处理保证响应；先响应再通过另一套系统调整响应结果。
实施、维护成本高。

5.flink

在这里插入图片描述

flink特点
支持有界流、无界流；
事件驱动：由接收到的事件为触发器，进行数据处理。
分层API：顶层更抽象，底层更具体。
dataStream Api用于做实事
dataSet用于做离线。
在这里插入图片描述
支持事件-时间、和处理时间予以
精确一次的状态一致性保证
递延次，每秒处理数百万个时间。

Flink vs Spark Streaming

流与微批处理（micro-batching）
架构设计上，spark Streaming就是通过攒批后处理的结构。
在这里插入图片描述
数据模型不同
- spark采用RDD模型，spark streaming的Dstream底层也是小批数据RDD的集合
- flink 就是以数据流为概念模型，时间事件序列
运行时的架构
- spark是批计算，通过DAG将job划分stage，一个执行后再执行下一个。
- flink是流执行模式，一个事件在处理完后直接发往下一个节点；根本原因还是事件与rdd微批的区别引起运行架构不同。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
flink简介

Apache flink是一个框架和分布式处理引擎，用于对无界和有界数据流进行状态计算。实时数据处理特性：低延迟高吞吐结果的准确和容错性来一条处理一条，还是攒一批（一定量、或者一定时间）再处理，同时满足低延迟、高吞吐、容错。流数据行业：物联网：传感器实时数据采集银行金融业电商、市场营销：数据报表、广告投放电信数据处理演变过程：（1）用户事件+后台处理+存储传统架构下，在数据量变得过大时，吞吐低，响应慢，甚至数据丢失2，离线处理能够处理大批量数据，但是响应慢第一
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。