kafka自动提交方式下的重复消费解决办法

最新推荐文章于 2024-08-09 11:06:07 发布

小酷Running

最新推荐文章于 2024-08-09 11:06:07 发布

阅读量3.1k

点赞数 4

分类专栏： kafka自动提交方式 kafka重复消费文章标签： kafka

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011801264/article/details/103921462

版权

kafka自动提交方式同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

kafka重复消费

1 篇文章 0 订阅

订阅专栏

最近项目上遇到一个kafka重复消费的问题，大体描述一下：

程序日志显示一直在重复消费从kafka中获取到的其中500条记录，处理这500条数据耗时8分钟。kafka的server.log日志一直在提示rebalance。

网上找了很多帖子，发现其中对于max.poll.records和session.timeout.ms两者关系的描述基本都是错误的，错误描述如下:

# max.poll.records条数据需要在session.timeout.ms这个时间内处理完，默认：500

# 即 max.poll.records * (处理能力) <= session.timeout.ms 可正常消费，不满足会出现rebalance

spring.kafka.consumer.max-poll-records=500

ok，口说无凭，实操一下：

配置如下：

spring.kafka.consumer.max-poll-records=20

spring.kafka.consumer.properties.session.timeout.ms=10000

处理程序每次用Thread.sleep(1000)来模拟，即程序的处理能力为1秒消费一条记录，安装上述配置，20条记录至少需要20秒，配置10秒显然不够，肯定会出现rebalance。

实测结果，正常处理，kafka也没有出现rebalance。

why? 显然，max.poll.records和session.timeout.ms两者的关系不是如此，继续深入一下。

我们再来看看上面的session.timeout.ms，指的是什么，为了准确，直接去官网：

翻译一下，基本就是说：

session.timeout.ms为会话的超时限制。如果consumer在这段时间内没有发送心跳信息，则它会被认为挂掉了，并且reblance将会产生，必须在[group.min.session.timeout.ms, group.max.session.timeout.ms]范围内。默认：10000。

显然并没有提到与max.poll.records的关系。

查阅官网，发现一个属性max.poll.interval.ms，官网描述如下：

基本意思就是消费者两次调用poll()取数据的最大延迟时间，超过这个时间消费组会发生rebalance。

消费者第一次poll到数据后，会开始消费，直到本次数据处理完毕，才会进行下一次poll，也就是说：

max.poll.records * (处理能力) <= max.poll.interval.ms，程序即可正常消费。

实操一下，现象确实如此，这里就不附带结果了。

写这篇帖子，主要是因为鄙人踩了这个坑，希望其它人不要继续了，哈哈。

从上面公式可以看到，我们只要保证程序处理能力稳定，不会随着时间或者数据量增大，那这rebalacnce就不会出现了。

可以采用异步消费的方式。

关注

4
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
kafka自动提交方式下的重复消费解决办法

最近项目上遇到一个kafka重复消费的问题，大体描述一下：程序日志显示一直在重复消费从kafka中获取到的其中500条记录，处理这500条数据耗时8分钟。kafka的server.log日志一直在提示rebalance。网上找了很多帖子，发现其中对于max.poll.records和session.timeout.ms两者关系的描述基本都是错误的，错误描述如下:# max.poll.r...
复制链接

扫一扫

专栏目录

小酷Running CSDN认证博客专家 CSDN认证企业博客

码龄11年

5: 原创

127万+: 周排名

97万+: 总排名

6727: 访问

: 等级

129: 积分

0: 粉丝

4: 获赞

1: 评论

6: 收藏

私信

关注

热门文章

分类专栏

最新评论

kafka自动提交方式下的重复消费解决办法
Java全栈研发大联盟: 处理程序每次用Thread.sleep(1000)来模拟，即程序的处理能力为1秒消费一条记录，安装上述配置，20条记录至少需要20秒，配置10秒显然不够，肯定会出现rebalance。实测结果，正常处理，kafka也没有出现rebalance。和你说的下面这句话之间有矛盾啊。上面说的是运行结果没有出现rebalance,而下面的理论却说应该出现Rebalance，矛盾 session.timeout.ms为会话的超时限制。如果consumer在这段时间内没有发送心跳信息，则它会被认为挂掉了，并且reblance将会产生，必须在[group.min.session.timeout.ms, group.max.session.timeout.ms]范围内。默认：10000。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。