flink入门-01-Flink 流处理简介

最新推荐文章于 2024-08-05 22:41:27 发布

步道师就是我

最新推荐文章于 2024-08-05 22:41:27 发布

阅读量1.3k

点赞数

分类专栏：大数据文章标签： flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/q287573145/article/details/123950391

版权

大数据专栏收录该内容

39 篇文章 18 订阅

订阅专栏

1、Flink 是什么

Flink 的全球热度

Flink 目前在国内企业的应用

2、为什么要用 Flink

• 流数据更真实地反映了我们的生活方式

• 传统的数据架构是基于有限数据集的

• 我们的目标

➢ 低延迟

➢ 高吞吐

➢ 结果的准确性和良好的容错性

哪些行业需要处理流数据

• 电商和市场营销

➢ 数据报表、广告投放、业务流程需要

• 物联网（IOT）

➢ 传感器实时数据采集和显示、实时报警，交通运输业

• 电信业

➢ 基站流量调配

• 银行和金融业

➢ 实时结算和通知推送，实时检测异常行为

3、流处理的发展和演变

传统数据处理架构

流处理的演变

4、Flink 的主要特点

4.1 事件驱动（Event-driven）

4.2 基于流的世界观

在 Flink 的世界观中，一切都是由流组成的，离线数据是有界的流；实时数据是一个没有界限的流：这就是所谓

的有界流和无界流

4.3 分层API

➢ 越顶层越抽象，表达含义越简明，使用越方便

➢ 越底层越具体，表达能力越丰富，使用越灵活

4.4 其它特点

➢ 支持事件时间（event-time）和处理时间（processing-time）语义

➢精确一次（exactly-once）的状态一致性保证

➢低延迟，每秒处理数百万个事件，毫秒级延迟

➢与众多常用存储系统的连接

➢高可用，动态扩展，实现7*24小时全天候运行

5、Flink vs Spark Streaming

5.1 流（stream）和微批（micro-batching）

5.2 数据模型

– spark 采用 RDD 模型，spark streaming 的 DStream 实际上也就是一组组小批数据 RDD 的集合

– flink 基本数据模型是数据流，以及事件（Event）序列

5.3 运行时架构

– spark 是批计算，将 DAG 划分为不同的** stage**，一个完成后才可以计算下一个

– flink 是标准的流执行模式，一个事件在一个节点处理完后可以直接发往下一个节点进行处理

步道师就是我

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
flink入门-01-Flink 流处理简介

1、Flink 是什么Flink 的全球热度Flink 目前在国内企业的应用2、为什么要用 Flink• 流数据更真实地反映了我们的生活方式• 传统的数据架构是基于有限数据集的• 我们的目标➢ 低延迟➢ 高吞吐➢ 结果的准确性和良好的容错性哪些行业需要处理流数据• 电商和市场营销➢ 数据报表、广告投放、业务流程需要• 物联网（IOT）➢ 传感器实时数据采集和显示、实时报警，交通运输业• 电信...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

步道师就是我 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。