flink源码分析_01-快学flink--map算子

在分布式计算框架中,需要处理分散在多台机器上的海量数据,对于大数据开发人员面临最大的挑战就是代码的编写、部署、调度、容错等。Flink在实时计算方面,提供流一个抽象的集即DataStream,开发者只要调用统一的编程API,传入具体的计算逻辑,不必太多关心底层的细节,就可以完成各种复杂的计算了,并且可以实现快速部署、资源调度、任务容错等,大大的提高了开发效率。

在开发Flink实时计算程序,首先学要创建StreamExecutionEnvironment,然后调用相应的Source算子创建原始的DataStream,然后调用零到多次Transformation(转换算子),每调用一次Transformation都会生成一个新的DataStream,最后调用Sink,我们写的程序就形成一个Data Flow Graph(数据流图),然后提交给JobManager,经过优化后生成包含有具体计算逻辑的Task实例,然后调度到TaskManager的slot中开始计算。这个过程非常复杂,具体详细的细节,在后面的源码分析部分在详细讲解!

0301e7469666fae4f5671e75fe1c25aa.png

下面我们来编写第一个Flink程序,实现简单的计算逻辑,就是通过fromCollection这个Source模拟数据,然后将每一个数字乘以10(本次的重点就是这个map算子),最后使用print sink打印。

public 

具体的动画演示如下:

2ad7878a47ff3fb85031f6dcb415f2ae.png
https://www.zhihu.com/video/1201923621725470720

如果想深入学习,请关注我的flink源码分析教程!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值