flink消费kafka 并行度和kafka的分区关系

最新推荐文章于 2024-07-12 08:45:00 发布

wppwpp1

最新推荐文章于 2024-07-12 08:45:00 发布

阅读量6.3k

点赞数 1

分类专栏： flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wppwpp1/article/details/115918607

版权

flink 专栏收录该内容

69 篇文章 4 订阅

订阅专栏

1、从消费端看，如果source的并行度大于kafka的分区，会导致多余的并行度消费不了数据，进而影响checkpoint，flink做checkpoint失败，所以一定不能大于分区数。

2 、从消费端看，如果source的并行度小于kafka的分区，会导致一个并行度消费多个kafka分区数据，如果数据量大的时候，吞吐率上不去。

3、sink到kafka时，如果并行度大于kafka的分区数时，则会轮训把数据插入到kafka分区中，数据不会丢失。

4、sink到kafka时，如果并行度小于kafka的分区数时，也会轮训把数据插入到kafka分区中，数据不会丢失。因为如果指定key的情况下，则producer会按照hash规则，把数据hash到相应分区中，

生产者数据写入规则( https://blog.csdn.net/zh2475855601/article/details/115346569).

5、也就是说flink sink的时候对kafka并行度影响不大，不会存在数据丢失或者分区没有写入的情况。

6、flink 任务 test_groupy_ttl_wpp

关注

1
点赞
踩
16

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。