flink 并行度任务链 task分配

最新推荐文章于 2024-01-19 11:02:37 发布

yagch

最新推荐文章于 2024-01-19 11:02:37 发布

阅读量4.4k

点赞数 4

分类专栏： flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34897849/article/details/103931374

版权

本文探讨了Flink中并行任务的分配，重点在于TaskManager的task slot管理和并行度的设置。内容包括：算子并行度设定、数据并行与计算并行的区别、任务链的形成条件、避免数据重分区的方法，以及如何通过共享组实现任务均衡。同时，文章介绍了并行度在代码、提交和配置文件中的设置优先级，并提供了禁止任务链合成的策略。

摘要由CSDN通过智能技术生成

flink 中并行任务的分配

在这里插入图片描述

Flink 中每一个 TaskManager 都是一个JVM进程，它可能会在独立的线程上执行一个或多个 subtask
为了控制一个 TaskManager 能接收多少个 task， TaskManager 通过 task slot 来进行控制（一个 TaskManager 至少有一个 slot）

slot 主要隔离内存，cpu 是slot之间共享的。也就是说4核的机器，内存足够，可以把slot设置为8。最多能同时运行8个任务。建议一个核心数分配一个slot
在这里插入图片描述
这种图中 source、map 合成的task的并行度为6
keyby 、window、apply合成的task的并行度为6
sink的并行度为1
总共有13个task
但是不是需要13个slot才能满足这个并行度的要求

不同的算子操作复杂度不同
我们可以称像source map sink 这种计算不复杂的算子称为非资源密集型的算子 aggregate reduce sum window 这种计算复杂的算子称为为资源密集型的算子

如果把这两种算子的优先级看作相同，平等的分配到slo中，当数据流source 来的数据速率相同时，会造成有些slot一直在跑复杂的算子，一直在运行中，当时一直跑简单算子的slot就会很空闲。

flink 这里是非资源密集型的算子和资源密集型的算子可以分配到同一个slot中，这样所有的slot之间任务就会平等，不会存在一直空闲一直高负载。

一个task的并行度是6 就会分为6个并行的task来跑，这六个task不能分配到同一个slot中必须一个slot只有一个。也就是说当你的集群的slot只有6 ，你不能设置算子的并行度超过6。

flink 也能做到把非资源密集型和资源密集型的算子分到不同的slot中这里需要设置共享组，非资源密集型的算子在一个共享组，资源密集型的算子在一个共享组，这样这两种算子就不会共享的使用slot。默认情况下算有算子都属于同一个共享组，共享所有slot。

默认

最低0.47元/天解锁文章

yagch CSDN认证博客专家 CSDN认证企业博客

码龄9年

52: 原创

7万+: 周排名

111万+: 总排名

11万+: 访问

: 等级

1315: 积分

119: 粉丝

35: 获赞

5: 评论

183: 收藏

私信

关注

热门文章

分类专栏

hive 15篇
maxwell 2篇
mac 2篇
flink 4篇
datax 2篇
redis 1篇
docker 2篇
股 1篇
sublime 1篇
canal 1篇
linux 3篇
cdh 2篇
sentry 1篇
phoenix 1篇
spark streaming 1篇
kafka 3篇
hbase 2篇
sqoop 17篇
nifi 1篇
flume 1篇
mysql 4篇

最新评论

hive 存储元数据信息支持中文
陈淀薄发: 如果表之前的characterset 是latin，现在即使表的characterset改成了utf8，字段的编码依然没有改，字段的编码也需要手动改。
Maxwell读取MySQL binlog日志到Kafka
CSDN-Ada助手: 非常感谢CSDN博主分享的“Maxwell读取MySQL binlog日志到Kafka”的技术文章。我觉得这篇博客对于想要了解如何实现MySQL binlog日志到Kafka的读取操作的读者非常有帮助。下一篇博客可以继续深入探讨Kafka的应用，比如可以写一篇“使用Kafka实现分布式日志收集”的技术文章，相信会有更多读者受益。期待你的下一篇精彩分享！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
docker 安装mysql 开启binlog 每天备份数据
qq_张先生: 你这是全量备份啊
sqoop 4种密码使用模式
帅气可爱又任性的凯哥: 你好，请问，sqoop1.4.5支持别名模式吗？
hbase 2.1.0 编译phoenix5.0.0
benpaodexiaowoniu: 楼主，你的二级索引是如何避免建立后插删数据均不报错如下的：https://ask.csdn.net/questions/710412

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。