生产故障｜Kafka消息发送延迟达到几十秒的罪魁祸首居然是....

最新推荐文章于 2024-07-09 20:53:22 发布

十一技术斩

最新推荐文章于 2024-07-09 20:53:22 发布

阅读量3.9k

点赞数

文章标签： kafka 分布式 big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/uuqaz/article/details/124729334

版权

双十一期间，Kafka集群响应时间升至10～30s，源于Broker与Zookeeper会话超时导致分区Leader选举。本文介绍了Zookeeper在Kafka中的角色，分析了会话超时的原因，包括临时节点删除、分区重新选举，以及客户端心跳处理机制，揭示了故障的根本原因。

摘要由CSDN通过智能技术生成

1、故障现象

笔者在双十一期间负责的kafka集群的响应时间飙升到了10～30s，严重影响消息的写入。

通过对日志分析发现存在大面积分区Leader选举，__consumer_offsets主题的分区也大量进行分区Leader选举，从而导致消息发送几乎停止，大量消费组触发重平衡，整个集群接近瘫痪，最终确定了根因：Broker节点与Zookeeper会话超时，触发大量分区重新选举。

本文借此故障，与大家一起剖析一下Zookeeper在Kafka中起了哪些作用，以及确定“罪魁祸首”的过程，希望给大家排查问题能带来一定的启发。

2、Zookeeper在Kafka中具有举足轻重的作用

在正式进入故障分析之前，我们首先介绍一下Zookeeper在kafka架构设计中所起的角色。

核心理念：kafka的设计者对待Zookeeper的使用是非常谨慎的，即需要依靠Zookeeper进行控制器选举，Broker节点故障实时发现，但又尽量降低对Zookeeper的依赖。

基于Zookeeper进行的程序开发，我们一般可以通过查看zookeeper中的目录布局，可以窥探出哪些功能是依靠Zookeeper完成，Kafka在Zookeeper中的存储目录结构如下图所示：

上述各个节点，其背后都关联着Kafka一个核心工作机制，大家可以顺藤摸瓜进行探究，本文需要重点介绍/brokers这个目录的布局与作用，目录详情如下：

/controller Kafka控制器的信息，Kafka控制器的选举依靠zookeeper。
/brokers/ids/{id} 在持久节点/brokers/ids下创建众多的临时节点，每一个节点，表示一个Broker节点，节点的内容存储了Broker的基本信息，例如端口、版本、监听地址等。
/brokers/topics/{topic}

最低0.47元/天解锁文章

十一技术斩

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

十一技术斩 CSDN认证博客专家 CSDN认证企业博客

码龄3年

487: 原创

3万+: 周排名

226万+: 总排名

117万+: 访问

: 等级

1万+: 积分

4524: 粉丝

3995: 获赞

396: 评论

1万+: 收藏

私信

关注

热门文章

最新评论

记录一次mysql update导致锁表问题
这Leslie_Lau: 逆天，我写的原文直接被你转载了，还开vip 原文在这里，各位也可以看文章的创建时间：https://here-leslie-lau.github.io/post/mysql/update_lock_table/
Java面试题大全、题+详细解答（2022版）
天蓝999: 可以的，我看的另一篇，我面试时90%以上的题目在下边这个博客里：https://knife.blog.csdn.net/article/details/121219272
RocketMQ保姆级教程
JavaMastergjh: 你好，请问为什么配了一个brokerIp1还要配一个brokerIp2呢
Java高级面试题整理（附答案）
天蓝999: 可以的，我看的另一篇，我面试时90%以上的题目在下边这个博客里：https://knife.blog.csdn.net/article/details/121219272
40道JAVA经典算法面试题（答案）
飞羽疾驰: 可以的，我看的另一篇，我面试时90%以上的题目在下边这个博客里：https://knife.blog.csdn.net/article/details/121219272

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。