flink初识

hxbxyz

于 2021-12-02 20:18:32 发布

阅读量94

点赞数

文章标签： flink 大数据 big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_57011804/article/details/121685237

版权

一.产生背景

实时流数据增多 : 互联网应用快速发展,实时流数据日益增多

价值更大: 实时流数据的处理和挖掘带来的价值比离线数据处理要多

大厂需求 : 各大互联网厂商需要一个能够快速响应和处理大规模实时流数据的技术

其他流处理引擎不能够满足需求 : storm/jstorm,sparkstreaming等

优秀的流处理引擎要求：低延时,高吞吐,容错性好,窗口时间语义化,编程效率高,运行效果好

storm/jstorm

优点：低延时

缺点：其他的都差一些
sparkstreaming

优点：高吞吐,容错性好

缺点：其他的都差一些

二.flink基本介绍

1.概念

Apache基金会开发的分布式的开源的流处理框架
scala和java编写
用于对有界和无界数据流进行有状态的计算

有界数据流:即实时数据流
无界数据流:即离线数据流,也称批处理数据

2.特点

适用所有常见的集群环境
内存计算,大规模处理
满足实时流处理引擎的全部需求
- 低延迟
- 高吞吐
- 容错性好
- 窗口时间语义化
- 编程效率高

3.应用场景

事件驱动型应用
数据分析型应用
数据管道ETL
要求严格的实时流处理场景

4.代码实现

实现方式：javaAPI，scalaAPI

数据处理过程抽象

将实时和离线数据处理的过程,均抽象成三个过程,及Source->Transform->Sink
Source 源数据读取
Transform 数据的转换
Sink 数据的落地

代码实现的复杂度

API丰富,支持SQL,复杂度不高

三.市场背景

现实情况
- 学习成高,开发人员少
- flink主要是互联网大厂在使用
发展趋势
- 实时数据处理需求逐渐变大
- flink对于实时数据的处理表现优异
- 得到了阿里的支持,发展前景极好

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
flink初识

一.产生背景实时流数据增多 : 互联网应用快速发展,实时流数据日益增多价值更大: 实时流数据的处理和挖掘带来的价值比离线数据处理要多大厂需求 : 各大互联网厂商需要一个能够快速响应和处理大规模实时流数据的技术其他流处理引擎不能够满足需求 : storm/jstorm,sparkstreaming等优秀的流处理引擎要求：低延时,高吞吐,容错性好,窗口时间语义化,编程效率高,运行效果好storm/jstorm优点：低延时缺点：其他的都差一些spa...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。