Flink基础学习记录(一)核心概念

本文讲述了ApacheFlink中的JobManager和TaskManager在分布式计算中的职责,强调了slot作为调度的基本单位,以及如何设置并行度、优先级和slot数量以优化性能。特别提到在YARN模式下,动态并发和slot的使用注意事项。
摘要由CSDN通过智能技术生成

架构

JobManager是老大,TaskManager是干活的。

一个作业一个jobMaster,通过分发器来启动。

TaskManager包含若干个task slots。

slot是资源调度最小单位,其数量限制了TaskManager能够并行处理的任务数量。

并行度、子任务

一个流程序的并行度,可以认为是其所有算子中最大的并行度。

设置优先级:算子 > env > 提交命令 > flink.conf

算子链

当不发生重分区时,算子是可以合并成算子链的。

可以手动解开,在排查问题的时候用到。

任务槽(Task Slots)

线程

taskmanager.numberOfTaskSlots

内存完全隔离,cpu不隔离

建议slot数量配置为机器的cpu核心数,避免不同任务cpu竞争

同一个作业中,不同算子的子任务,可以在同一个slot上同时执行。前提是属于同一个slot共享组,默认都是“default”。算子.slotSharingGroup("组名")

任务槽和并行度

任务槽:静态,最大的并发上限

并发度:动态,实际使用的并发

slot任务槽数量 >= 并发度,job才能运行

注意:yarn模式,动态会申请TM

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值