Flink执行流程

1、flink关键字对比spark

flinkspark
operatorRDD
operator chainstage
data flowDAG
one to one窄依赖
redistribute宽依赖
subtasktask
tasktaskset
partitionpartition
ParallelismParallelism

2、任务调度流程

  • client向HDFS提交flink的jar包和相关配置
  • 然后向resourceManager提交任务,resourceManager分配Container资源并通知相应的NodeManager启动ApplicationMaster
  • ApplicationMaster启动后加载flink的jar包和相关配置,同时启动jobManager
  • ApplicationMaster向resourceManager申请资源启动taskManager
  • resourceManager为taskManager分配资源后,由ApplicationMaster在对应的NodeManager上启动taskManager
  • taskManager启动完成后,加载flink的jar包和相关配置
  • taskManager向jobManager发送心跳包汇报运行状况,等待jobManager分配运行任务

3、Flink的执行图

  • Flink会根据代码执行流程生成DAG数据流图,生成顺序为:streamGraph、jobGraph、executionGraph、物理执行图
    • 1、streamGraph:程序原始执行流程图,也就是算子的依赖关系,在client上生成
    • 2、jobGraph:对程序执行流程图进行一定程度的优化,如将one to one的operator生成operator chain,在client上生成
    • 3、executionGraph:对程序中设置的并行度和提交的资源进行并行规划,在jobManager上生成
    • 4、物理执行图:将executionGraph的并行计划落实到taskManager上,将subTask落实到具体的taskSlot上

4、Flink运行的组件

在这里插入图片描述

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值