Flink实战之Flink SQL connector支持并行度配置

最新推荐文章于 2024-02-20 16:51:06 发布

VIP文章优优我心

最新推荐文章于 2024-02-20 16:51:06 发布

阅读量6.3k

点赞数 1

分类专栏： Flink Flink实战系列文章标签： flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41608066/article/details/108557869

版权

背景

目前flink sql是不支持source/sink并行度配置的，flink sql中各算子并行度默认是根据source的partition数或文件数来决定的，比如常用的kafka source topic的partition是100，那么fink sql任务的并发就是100。但有时任务相对简单，比如datax任务，没有逻辑根本不需要很大的并发，100并发显然会造成资源的严重浪费。那么就有必要扩展connector使其支持并发度配置。

如何做

一、首先，需要在ddl的with参数中支持并发的配置，比如定义’parallelism‘ = ’10‘。
二、需要各connector支持这个参数的解析，这里分1.11版本之前还是之后。

1.11前

1.11版本，对Table接口进行了重构，在这之前实现一个connector需要做哪些，请见Flink实战之自定义flink sql connector。这里就以kafka为例来说明。
当ddl增加了parallelism配置之后，如何让connector识别呢？

需要在KafkaTableSourceSinkFactoryBase#supportedProperties增加一行properties.add(“parallelism”);
parallelism的配置所在的properties会传递到KafkaTableSourceBase或KafkaTableSinkBase
这是就看你是需要扩展source还是sink或者两者都要了，source的话在KafkaTableSource

最低0.47元/天解锁文章

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Flink实战之Flink SQL connector支持并行度配置

背景目前flink sql是不支持source/sink并行度配置的，flink sql中各算子并行度默认是根据source的partition数或文件数来决定的，比如常用的kafka source topic的partition是100，那么fink sql任务的并发就是100。但有时任务相对简单，比如datax任务，没有逻辑根本不需要很大的并发，100并发显然会造成资源的严重浪费。那么就有必要扩展connector使其支持并发度配置。如何做一、首先，需要在ddl的with参数中支持并发的配置，比如
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。