MQ消息积压CPU打满导致不同服务接口超时异常

最新推荐文章于 2023-11-10 15:08:07 发布

Relian哈哈

最新推荐文章于 2023-11-10 15:08:07 发布

阅读量1.2k

点赞数 1

分类专栏： Kafka MQ 文章标签：数据库 java eclipse

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lzxlfly/article/details/117789426

版权

MQ 同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

一、问题现象

一天突然收到线上不同MQ消息积压告警，于是去消息界面查看积压情况，同一个服务所在的多个MQ出现不同程度的积压，应该不是业务导致的正常积压，猜测可能是服务出了问题

二、问题排查

1、依赖rpc接口超时

于是去查看服务日志，调用多个不同方的rpc接口都出现超时，应该不是提供方接口问题，因为不可能所有提供方接口都出现问题

2、MQ消费请求超时

再往下看，发现MQ消费请求也出现请求超时，找不到消息ID

Not found future which msgId is 45 when receive response. May be this future have been removed because of timeout

3、CPU超负荷

不同种类的服务的都出现超时，确定和服务本身没有关系，猜测可能和服务器本身有关系，于是去查看服务器资源使用情况，发现CPU达到了99%，出现了超负荷，问题终于找到了。

三、问题解决

CPU超负荷，于是赶紧申请8台新机器，增加服务部署数量，观察一会儿，CPU有所降低，达到90%做左右。但是还不够，又增加了8台新机器部署。再观察一会后，CPU降到70%多。前后增加16台机器部署，经过了1个多小时，终于消费完毕。

四、原因分析

此次消息积压，正直618前后，服务里边的消息包括不限于图片、商品、促销等5种消息类型。都是非常大的消息流，一次消息来袭少则几千条，多则三五十万条不等，加之正直618电商大促，各种图片、促销等消息量猛增。机器数量少，导致CPU超负荷，不能正常工作。从而出现大量内外部接口请求超时。简单总结如下：

1、时候原因

正直618大促前后，消息量大大高于平时

2、业务原因

消息本身体量量大，多个topic一次消息来袭少则几千条，多则三五十万条不等

3、服务设计原因

多个大体量消息融合部署-应该根据业务及量级，充分考虑拆分不同服务部署，不应该多种消息融合部署

4、消息量预估不足

应当提前预估每个业务消息量级，合理部署服务数量，充分做好备战准备

5、监控不足

因为不是核心服务，没能对CPU、网路、磁盘、内存等服务器硬件指标做好监控，做到及时发现解决问题，从而避免消息长时间积压

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
MQ消息积压CPU打满导致不同服务接口超时异常

Not found future which msgId is 45 when receive response. May be this future have been removed because oftimeout
复制链接

扫一扫

专栏目录

Relian哈哈 CSDN认证博客专家 CSDN认证企业博客

码龄8年

152: 原创

3万+: 周排名

227万+: 总排名

114万+: 访问

: 等级

6657: 积分

195: 粉丝

526: 获赞

178: 评论

2993: 收藏

私信

关注

热门文章

分类专栏

最新评论

elasticsearch7常见查询（term、match、bool、filter、match）
青青草原一匹野码: term可以查询字段类型是text的数据，term区别于match是在检索的时候不对查询参数进行分词，是直接用整个查询参数与text类型的字段分词后的词进行匹配；而match会先对查询参数进行分词，再跟字段类型为text的字段分词后的词进行匹配。
elasticsearch7常见查询（term、match、bool、filter、match）
萌萌小怪兽^_^: 我理解的是：term只能查单个词，text默认分词器下中文是单个字为一个词，英文是每个单词为一个词。可以用term只查text的一个字。
elasticsearch7常见查询（term、match、bool、filter、match）
daleHaven: 博主您好，我是一个es新手有一个想法想和您交流一下，我能不能用term查询来查找字段类型是text的呢？我的意思是我想看看分词器分出来的词，因为我检索时总检索不到，但明明又是存在的，我就怀疑是不是分词器有啥问题导致我在match时不能正常返回，所以想用term来验证一下。
hive&presto日期与字符串转换
CSDN-Ada助手: 如何在 Hive 中进行数据的分割和分片？
Kafka的Rebalance机制可能造成的影响及解决方案
站在巨人肩膀上的CV工程师: 还有一种情况，上新服务增加消费者时也会触发

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。