Flink实战（一）

最新推荐文章于 2024-05-24 01:29:00 发布

子毅168

最新推荐文章于 2024-05-24 01:29:00 发布

阅读量6.9k

点赞数 5

分类专栏：大数据文章标签： Flink Flink实战 Flink快速入门流计算

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42529806/article/details/88067433

版权

大数据专栏收录该内容

32 篇文章 4 订阅

订阅专栏

文章目录

Flink实战（一）
- Flink概述

Flink实战（一）

Flink概述

Flink是什么

定义

Apache Flink是一个分布式的大数据计算引擎
能够对有限和无限数据集进行有状态的计算
可以部署在各种集群环境
可以对各种规模的数据进行快速准确的计算

Stateful Computations over Data Streams

Apache Flink

数据源：交易数据、日志数据、物联网设备数据、点击流数据等
应用：事件驱动应用、数据流管道应用、流、批数据分析
官网

flink-apache地址：https://flink.apache.org/
flink-china地址：https://flink-china.org/
商业运营公司：https://data-artisans.com

Flink的诞生和发展

Flink诞生

诞生:诞生于2009年，德国柏林工业大学的名为StratoSphere研究性项目，最初主要专注于批处理；直到14年捐献给Apache之后，更名为Flink，并迅速孵化成Apache顶级项目，并且定位是流计算
发展:发展历程

可以看出，Flink诞生比Spark、Storm都早，但是是在捐献给apache之后,得到迅速发展，并且目前在流计算领域拥有很大影响力
其中2015年，是大数据流计算框架层出不穷的时期，包括Storm、SparkStreaming、Flink、Dataflow（谷歌的）等等，而Flink是最接近谷歌Dataflow的开源实现

Flink特性

流、批统一
支持java、scalaAPI、Python（还在完善中）
高吞吐、低延时
复杂事件处理、处理乱序
不同的时间语义（Event Time、Ingestion Time、Process Time）下支持灵活的窗口（Time Window、Rolling Window、Sliding Window、Session Window、以及自定义窗口）
Exactly Once语义
自动反压机制（阻塞生产端从而保证正在运行的flink task不受影响）
支持图计算、机器学习、复杂事件处理
高效的自定义内存管理
集成的Hadoop、Hdfs、MR、Hbase等Hadoop生态圈组件

Flink的生态与未来

核心组件

组件

部署支持：本地JVM（调试的时候用）、集群（Standalone || Yarn）、云上
底层Flink Runtime
流处理API：DataStream API；批处理API:DataSet API
最上层：CEP复杂事件处理（规则匹配）、SQL&Table API（可以和DataStream API、DataSet API互相转换）、FlinkML（机器学习）、Gelly（图计算）

生态

Flink生态

Source：HDFS、Hbase、Kafka、RabbitMQ等等
数据处理引擎：Flink各个组件
Sink：HDFS、Hbase、Kafka、RabbitMQ、ES等等

Flink未来

批处理的突破，流批融合
增加多种语言的支持
完善Flink ML算法库，会向更成熟的机器学习、深度学习框架去集成（例如：谷歌的TensorFlow on Flink）

Flink Use Cases

Flink主要应用场景

Event-Drive APP（事件驱动）
Data-Analytics APP（数据分析）
Data-Pipeline APP（管道式ETL）

案例

阿里Flink应用场景
阿里Flink应用场景案例分析—欺诈检测

Flink vs Spark

流处理框架对比

Flink vs Spark

API
Connectors
Runtime Env
总体对比

Spark生态上更完善、在机器学习的集成和易用性上优势大些
Flink在流计算上有绝对优势，并且在核心架构和模型上更通透以及灵活
在易用性上面，以及各自的短板上需要继续努力

关注

5
点赞
踩
31

收藏

觉得还不错? 一键收藏
0
评论
Flink实战（一）

文章目录Flink实战（一）Flink概述Flink是什么定义Stateful Computations over Data StreamsFlink的诞生和发展Flink特性Flink的生态与未来核心组件生态Flink未来Flink Use CasesFlink主要应用场景案例Flink vs Spark流处理框架对比Flink vs SparkFlink实战（一）Flink概述Flink...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。