大数据处理技术之flink初识

一.产生背景

  • 实时流数据增多 : 互联网应用快速发展,实时流数据日益增多
  • 价值更大: 实时流数据的处理和挖掘带来的价值比离线数据处理要多
  • 大厂需求 : 各大互联网厂商需要一个能够快速响应和处理大规模实时流数据的技术
  • 其他流处理引擎不能够满足需求 : storm/jstorm,sparkstreaming等
    • 优秀的流处理引擎要求
      • 低延时,高吞吐,容错性好,窗口时间语义化,编程效率高,运行效果好
    • storm/jstorm
      • 优点
        • 低延时
      • 缺点
        • 其他的都差一些
    • sparkstreaming
      • 优点
        • 高吞吐,容错性好
      • 缺点
        • 其他的都差一些

二.flink基本介绍

1.概念

  • Apache基金会开发的分布式开源流处理框架
  • scala和java编写
  • 用于对有界和无界数据流进行有状态的计算
    • 有界数据流:即实时数据流
    • 无界数据流:即离线数据流,也称批处理数据

2.特点

  • 适用所有常见的集群环境
  • 内存计算,大规模处理
  • 满足实时流处理引擎的全部需求
    • 低延迟
    • 高吞吐
    • 容错性好
    • 窗口时间语义化
    • 编程效率高

3.应用场景

  • 事件驱动型应用
  • 数据分析型应用
  • 数据管道ETL
  • 要求严格的实时流处理场景

4.代码实现

  • 实现方式
    • javaAPI
    • scalaAPI
  • 数据处理过程抽象
    • 将实时和离线数据处理的过程,均抽象成三个过程,及Source->Transform->Sink
      • Source 源数据读取
      • Transform 数据的转换
      • Sink 数据的落地
  • 代码实现的复杂度
    • API丰富,支持SQL,复杂度不高

三.版本发展与介绍

  • flink0.6 初步得到团队认可,快速迭代发展 2014年
  • flink0.9-milestone 有重大进展,正式对外发布 2015年
  • flink0.9 阿里引入,并进行了优化改名blink 2015年
  • flink1.0 里程碑 2016年
  • flink1.9 目前市场占有率较高的版本 2019年
  • flink1.1 加入了很多特性,支持hadoop3.x版本
  • flink1.13.1 版本稳定

四.市场背景

  • 现实情况
    • 学习成高,开发人员少
    • flink主要是互联网大厂在使用
  • 发展趋势
    • 实时数据处理需求逐渐变大
    • flink对于实时数据的处理表现优异
    • 得到了阿里的支持,发展前景极好
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Antgeek

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值