消息队列之堆积问题分析

最新推荐文章于 2024-11-03 12:44:11 发布

爱吃芝士的土豆倪

最新推荐文章于 2024-11-03 12:44:11 发布

阅读量780

点赞数 15

分类专栏： kafka 文章标签：消息队列消息堆积 kafka

本文链接：https://blog.csdn.net/qq_40851232/article/details/135423101

版权

kafka 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

👏作者简介：大家好，我是爱吃芝士的土豆倪，24届校招生Java选手，很高兴认识大家
📕系列专栏：Spring源码、JUC源码、Kafka原理、分布式技术原理、数据库技术
🔥如果感觉博主的文章还不错的话，请👍三连支持👍一下博主哦
🍂博主正在努力完成2023计划中：源码溯源，一探究竟
📝联系方式：nhs19990716，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬👀

文章目录

消息队列之堆积问题分析及各种解决方案

消息队列之堆积问题分析及各种解决方案

问题描述

在高并发的场景中，消息积压问题，可以说如影随形，真的没办法从根本上解决。表面上看，已经解决了，但后面不知道什么时候，就会冒出一次，比如这次：

有天下午，产品过来说：有几个商户投诉过来了，他们说菜品有延迟，快查一下原因。

这次问题出现得有点奇怪。

为什么这么说？

首先这个时间点就有点奇怪，平常出问题，不都是中午或者晚上用餐高峰期吗？怎么这次问题出现在下午？

根据以往积累的经验，我直接看了kafka的topic的数据，果然上面消息有积压，但这次每个partition都积压了十几万的消息没有消费，比以往加压的消息数量增加了几百倍。这次消息积压得极不寻常。

我赶紧查服务监控看看消费者挂了没，还好没挂。又查服务日志没有发现异常。这时我有点迷茫，碰运气问了问订单组下午发生了什么事情没？他们说下午有个促销活动，跑了一个JOB批量更新过有些商户的订单信息。

这时，我一下子如梦初醒，是他们在JOB中批量发消息导致的问题。怎么没有通知我们呢？实在太坑了。

虽说知道问题的原因了，倒是眼前积压的这十几万的消息该如何处理呢？

此时，如果直接调大partition数量是不行的，历史消息已经存储到4个固定的partition，只有新增的消息才会到新的partition。我们重点需要处理的是已有的partition。

解决问题思路分析

扩容？

事实上，遇到这种问题恐怕我们的第一反应都是扩容，但是扩容是否真的能够解决问题呢？

是否能够解决所有的问题呢？

根据问题描述，历史消息已经被存储到4个固定的分区中，只有新增的消息才会到新的分区中，所以我们的重点是处理已有的分区，那么回到扩容问题，因为现有分区已经和消费者组里面的消费者一对一了，所以哪怕我们增加分区，或者消费者组里面的消费者，会触发消费再均衡，但是因为突发情况导致消费者消费能力不够，所以哪怕扩容，也不会很快的改善这个堆积问题。