【Flink原理和应用】:Flink的并发执行(Parallel Execution)

本文详细介绍了Flink的并发执行机制,包括slot和parallelism的概念及其关系。slot代表taskmanager的并发执行能力,而parallelism是运行时实际的并发度。设置合适的parallelism对于提高运算效率至关重要。并行度可通过算子级别、运行环境级别、客户端级别或系统级别进行设置,优先级依次降低。
摘要由CSDN通过智能技术生成

1. Flink的并发执行

本章描述如何在Flink中配置程序的并发执行,一个Flink程序可以由不同的task(如:transformations/opterators,data sources及data sinks等)组成,一个task会分发到多个并发实例中运行,并且每个并发实例处理task的部分输入数据集。一个task的并发实例数叫做parallelism。在这之前有必要先了解下slot和parallelism的关系。

slot和parallelism

1.slot是指taskmanager的并发执行能力
在这里插入图片描述

taskmanager.numberOfTaskSlots:3

每一个taskmanager中的分配3个TaskSlot,3个taskmanager一共有9个TaskSlot

2.parallelism是指taskmanager实际使用的并发能力
在这里插入图片描述
parallelism.default:1

运行程序默认的并行度为1,9个TaskSlot只用了1个,有8个空闲。设置合适的并行度才能提高效率。

slot和parallelism总结

1.slot是静态的概念,是指taskmanager具有的并发执行能力
2.parallelism是动态的概念,是指程序运行时实际使用的并发能力
3.设置合适的parallelism能提高运算效率,太多了和太少了都不行

2.parallelism的设置

parallelism是可配置、可指定的。看下图:
在这里插入图片描述

parallelism的设定方式:

  1. 算子(operator)级别:可以通过设置flink的编程API修改过并行度;
  2. 运行环境级别:可以通过设置executionEnvironmentk的方法修改并行
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值