大数据处理技术之flink初识

一.产生背景

实时流数据增多 : 互联网应用快速发展,实时流数据日益增多
价值更大: 实时流数据的处理和挖掘带来的价值比离线数据处理要多
大厂需求 : 各大互联网厂商需要一个能够快速响应和处理大规模实时流数据的技术
其他流处理引擎不能够满足需求 : storm/jstorm,sparkstreaming等
优秀的流处理引擎要求
低延时,高吞吐,容错性好,窗口时间语义化,编程效率高,运行效果好
storm/jstorm
优点
低延时
缺点
其他的都差一些
sparkstreaming
优点
高吞吐,容错性好
缺点
其他的都差一些

二.flink基本介绍

1.概念

Apache基金会开发的分布式的开源的流处理框架
scala和java编写
用于对有界和无界数据流进行有状态的计算
有界数据流:即实时数据流
无界数据流:即离线数据流,也称批处理数据

2.特点

适用所有常见的集群环境
内存计算,大规模处理
满足实时流处理引擎的全部需求
低延迟
高吞吐
容错性好
窗口时间语义化
编程效率高

3.应用场景

事件驱动型应用
数据分析型应用
数据管道ETL
要求严格的实时流处理场景

4.代码实现

实现方式
javaAPI
scalaAPI
数据处理过程抽象
将实时和离线数据处理的过程,均抽象成三个过程,及Source->Transform->Sink
Source 源数据读取
Transform 数据的转换
Sink 数据的落地
代码实现的复杂度
API丰富,支持SQL,复杂度不高

三.版本发展与介绍

flink0.6 初步得到团队认可,快速迭代发展 2014年
flink0.9-milestone 有重大进展,正式对外发布 2015年
flink0.9 阿里引入,并进行了优化改名blink 2015年
flink1.0 里程碑 2016年
flink1.9 目前市场占有率较高的版本 2019年
flink1.1 加入了很多特性,支持hadoop3.x版本
flink1.13.1 版本稳定

四.市场背景

现实情况
学习成高,开发人员少
flink主要是互联网大厂在使用
发展趋势
实时数据处理需求逐渐变大
flink对于实时数据的处理表现优异
得到了阿里的支持,发展前景极好
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

mizui_i

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值