Flink简介—大数据技术

最新推荐文章于 2024-08-05 21:43:10 发布

Alpha_GoGo

最新推荐文章于 2024-08-05 21:43:10 发布

阅读量297

点赞数

分类专栏：大数据技术文章标签：大数据 flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Alpha_GoGo/article/details/119783100

版权

大数据技术专栏收录该内容

1 篇文章 0 订阅

订阅专栏

Flink是什么？

Apache Flink 是一个框架和分布式处理引擎，用于对无界和有界数据流进行状态计算。

国内使用Flink的企业，挺多的

为什么要用Flink？

流数据更加符合生活中数据的真实性
传统的数据架构均是基于有限数据集的
Flink可以实现低延迟、高吞吐、结果的准确性和良好的容错性

哪些行业中需要处理流数据？

电商和市场营销：数据报表、广告投放、业务流程需要
物联网（IOT）：传感器实时数据采集和显示、实时报警，交通运输业
电信业：基站流量调配
银行和金融业：实时结算和通知推送，实时检测异常行为

Flink 的主要特点

事件驱动（Event-driven）

基于流的世界观：在 Flink 的世界观中，一切都是由流组成的，离线数据是有界的流；实时数据是一个没有界限的流：这就是所谓的有界流和无界流
分层API：越顶层越抽象，表达含义越简明，使用越方便；越底层越具体，表达能力越丰富，使用越灵活

支持事件时间（event-time）和处理时间（processing-time）语义
精确一次（exactly-once）的状态一致性保证
低延迟，每秒处理数百万个事件，毫秒级延迟
与众多常用存储系统的连接
高可用，动态扩展，实现7*24小时全天候运行

Flink和Spark Streaming有什么区别？

Flink是流（stream），而Spark Streaming是微批（micro-batching）

• 数据模型：

– spark 采用 RDD 模型，spark streaming 的 DStream 实际上也就是一组组小批

数据 RDD 的集合

– flink 基本数据模型是数据流，以及事件（Event）序列

运行时架构

– spark 是批计算，将 DAG 划分为不同的 stage，一个完成后才可以计算下一个

– flink 是标准的流执行模式，一个事件在一个节点处理完后可以直接发往下一个节

点进行处理

感谢大佬们点赞、关注o(╯□╰)o　

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Flink简介—大数据技术

Flink是什么？Apache Flink 是一个框架和分布式处理引擎，用于对无界和有界数据流进行状态计算。国内使用Flink的企业，挺多的为什么要用Flink？流数据更加符合生活中数据的真实性传统的数据架构均是基于有限数据集的 Flink可以实现低延迟、高吞吐、结果的准确性和良好的容错性哪些行业中需要处理流数据？电商和市场营销：数据报表、广告投放、业务流程需要物联网（IOT）：传感器实时数据采集和显示、实时报警，交通运输业
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Alpha_GoGo 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。