kafka超时异常

最新推荐文章于 2024-08-15 21:36:03 发布

loopnz_

最新推荐文章于 2024-08-15 21:36:03 发布

阅读量256

点赞数 1

分类专栏： kafka 文章标签： kafka 分布式

本文链接：https://blog.csdn.net/qq_27129213/article/details/132137799

版权

kafka 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

kafka超时异常

Kafka Handle Error, Client Will Seek Soon: org.apache.kafka.clients.consumer.CommitFailedException: Commit cannot be completed since the group has already rebalanced and assigned the partitions to another member. This means that the time between subsequent calls to poll() was longer than the configured max.poll.interval.ms, which typically implies that the poll loop is spending too much time message processing. You can address this either by increasing the session timeout or by reducing the maximum size of batches returned in poll() with max.poll.records.

因为一次性poll拉取（默认500）消息后处理时间过长，导致两次拉取时间间隔超过了max.poll.interval.ms阈值（默认五分钟）,集群以为消费线程挂了，触发了rebanlance。当消费完了再去同步游标报错了，然后游标回滚，导致部分重复消费。

消费者参数

参数名	框架默认值	含义	备注
fetch.max.wait.ms	0.5s	每次拉取最大等待时间	和下面一个参数fetch.min.bytes配合使用
fetch.min.bytes	1b	每次拉取最小字节数	只要有消息或者每隔0.5s拉取一次
heartbeat.interval.ms	3s	向协调器发送心跳的时间间隔	和下一个参数session.timeout.ms参数配合使用，建议不超过session.timeout.ms的1/3
session.timeout.ms	30s	30s消费者不发送心跳认为消费者挂了	配置太大会导致真死消费者检测太慢，太小会检测到假死，触发不必要的rebanlance。
max.poll.records	50	每次拉取条数
max.poll.interval.ms	300s	拉取时间间隔	每次拉取的记录必须在该时间内消费完

6个参数是3对，通俗理解如下：

1，2配合使用，告诉kafka集群，我消费者的处理能力，每秒至少能消费掉

3，4配合使用，告诉kafka集群，在我没事情干的时候，多久尝试拉取一次数据，即使此时没有数据（所以要处理空消息）

5，6配合使用，告诉kafka集群，什么情况你可以认为整个消费者挂了，触发rebanlance

【max.poll.interval.ms和session.timeout.ms区别】

KIP-62前只有session.timeout.ms参数

KIP-62后不通过poll()方法发送心跳，而是后台一个心跳线程，这就允许单次poll处理更长时间。不会因为单次处理超时假死引发不必要的rebanlance

max.poll.interval.ms 检测消费者处理线程死亡

session.timeout.ms 检测整个消费者死亡

loopnz_

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
kafka超时异常

当消费完了再去同步游标报错了，然后游标回滚，导致部分重复消费。KIP-62后不通过poll()方法发送心跳，而是后台一个心跳线程，这就允许单次poll处理更长时间。 3，4配合使用，告诉kafka集群，在我没事情干的时候，多久尝试拉取一次数据，即使此时没有数据（所以要处理空消息） 5，6配合使用，告诉kafka集群，什么情况你可以认为整个消费者挂了，触发rebanlance。 1，2配合使用，告诉kafka集群，我消费者的处理能力，每秒至少能消费掉。检测消费者处理线程死亡。
复制链接

扫一扫

专栏目录