Kafka 实战 - Kafka消费者生产经验之分区的分配及再平衡、数据积压和消费者事务

用心去追梦

于 2024-04-11 10:51:41 发布

阅读量403

点赞数 4

文章标签： kafka 分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33240556/article/details/137630815

版权

Apache Kafka 的消费者在实际使用中，往往会面临分区分配与再平衡、数据积压以及消费者事务等挑战。以下是对这些实战经验的详细解析：

1. 分区分配与再平衡

分区分配：

分组消费：消费者通过指定相同的 group.id 形成消费组。Kafka 为每个分区分配一个消费组内的消费者，确保分区内的消息只被组内一个消费者消费。
分配策略：Kafka 提供多种分配策略，如 Range、RoundRobin 等，可根据业务需求选择合适的策略。默认为 StickyAssignor，尽可能保持分区与消费者之间的绑定关系，减少再平衡时的数据迁移。

再平衡：

触发条件：消费组成员变化（新增、退出或崩溃）、Broker 变化（新增、下线或分区重分配）都会触发再平衡。
流程：消费者发送 LeaveGroup 请求，协调者触发 Rebalance，重新分配分区所有权，消费者收到 Assignments 后开始消费新分配的分区。

经验与优化：

避免频繁再平衡：控制消费组成员的增删，尽量避免短时间内大量消费者同时加入或离开。合理设置 session.timeout.ms 和 heartbeat.interval.ms，减少因心跳超时导致的误判。
监控再平衡：通过监控 kafka.consumer:type=coordinator,name=Rebalance MBean，观察再平衡次数、耗时等指标，及时发现异常。
再平衡回调：在消费者实现中处理 onPartitionsRevoked 和 onPartitionsAssigned 回调，确保在再平衡前后正确暂停消费、提交 offset、清理资源。

2. 数据积压

原因：

消费速度慢于生产速度：消费者处理能力不足或处理逻辑复杂，导致消息积压在 Broker 或消费者缓存中。
消费者故障：消费者长时间无法正常工作，无法消费分配的分区消息。
网络延迟或拥塞：网络问题导致消息拉取速度下降，消息积压在 Broker。

应对策略：

提升消费能力：增加消费者实例、优化消费逻辑、提升硬件性能，提高消息处理速度。
监控与告警：设置消费 lag 监控和告警，及时发现并处理积压问题。
临时扩容：在数据洪峰或故障恢复期间，临时增加消费者实例或提升消费者性能，快速消化积压数据。
限流生产：在不得已的情况下，可以考虑在生产端实施限流，减轻 Broker 和消费者的负担。

3. 消费者事务

Kafka 事务（Kafka 0.11+）：

事务性生产：生产者开启事务，确保一批消息要么全部成功发送，要么全部失败。
事务性消费：消费者开启事务，将消息消费与下游操作（如数据库写入）纳入同一个事务，实现 Exactly Once 语义。

使用场景：

跨系统一致性：在涉及多个系统的业务流程中，确保 Kafka 消息的生产和消费与其他操作（如数据库更新）保持原子性。
补偿逻辑简化：启用事务后，可以简化或去除原先用于处理消息重试或回滚的补偿逻辑。

注意事项：

性能影响：启用事务会增加一定的性能开销，尤其是在使用两阶段提交（Prepare + Commit）时。
兼容性：确保上下游系统支持事务，否则无法实现 Exactly Once。
异常处理：虽然事务可以保证消息处理的一致性，但仍需在消费者中实现适当的异常处理和重试逻辑。

通过妥善处理 Kafka 消费者的分区分配与再平衡、有效应对数据积压问题以及合理使用消费者事务，可以显著提升 Kafka 消费的稳定性和数据处理的准确性，确保业务逻辑正确执行。同时，持续监控与优化消费性能，是保持 Kafka 集群健康运行的关键。

用心去追梦

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Kafka 实战 - Kafka消费者生产经验之分区的分配及再平衡、数据积压和消费者事务

通过妥善处理 Kafka 消费者的分区分配与再平衡、有效应对数据积压问题以及合理使用消费者事务，可以显著提升 Kafka 消费的稳定性和数据处理的准确性，确保业务逻辑正确执行。同时，持续监控与优化消费性能，是保持 Kafka 集群健康运行的关键。Apache Kafka 的消费者在实际使用中，往往会面临分区分配与再平衡、数据积压以及消费者事务等挑战。
复制链接

扫一扫

用心去追梦

博客等级

码龄9年

北京知行俊秀网络科技有限公司官方账号

3201
原创

1万+
点赞

1万+
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

最新评论

okhttp3.RequestBody.create(Ljava/lang/String；Lokhttp3/MediaType；)Lokhttp3/RequestBody； at com.alibab
小王毕业啦: 博主的这篇文章真是太有价值了！通过对"okhttp3.RequestBody.create(Ljava/lang/String；Lokhttp3/MediaType；)Lokhttp3/RequestBody； at com.alibab-CSDN博客"这个主题的深入分析，我对这个技术有了全新的认识。文章中的细节描写非常到位，让我感受到了博主的深厚功底和专业知识。期待着博主未来能够持续分享更多类似的好文，同时也希望能够得到博主的指导，共同进步。再次感谢博主的无私分享和支持！
Ribbon和Feign的区别？
sinat_41703851: Ribbon通常与Spring Cloud中的其他组件（如Eureka、Hystrix等）一起使用，以实现服务的自动发现和负载均衡。 Ribbon是一个独立的开源项目，可以与其他Java框架一起使用，如Spring Boot和Spring MVC。这两者是不是有点矛盾
Kubernetes - 实战：Ingress
因为艾，所以爱: raw.githubusercontent.com 访问不了了
Kubernetes - 实战：Ingress
因为艾，所以爱: https://raw.githubusercontent.com访问不了了
解决idea npm : 无法将“npm”项识别为 cmdlet、函数、脚本文件或可运行程序的名称
848698119: 厉害，优质博文，点赞

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。