【RabbitMQ篇】消息堆积/丢失解决办法

最新推荐文章于 2025-05-19 14:15:21 发布

_Romeo

最新推荐文章于 2025-05-19 14:15:21 发布

阅读量4.1k

点赞数 2

CC 4.0 BY-SA版权

分类专栏： rabbitmq 文章标签： rabbitmq

本文链接：https://blog.csdn.net/Number_oneEngineer/article/details/127357421

rabbitmq 专栏收录该内容

4 篇文章

订阅专栏

本文探讨了MQ消息堆积的临时扩容、过期丢弃与重导策略，以及丢失预防的事务机制、confirm确认和数据持久化。还介绍了如何避免消息重复消费，涉及状态跟踪和确认机制。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、MQ消息堆积处理

1. 临时扩容，以更快的速度去消费数据

解决方案：
这种时候只能操作临时扩容，以更快的速度去消费数据了。具体操作步骤和思路如下：

①先修复consumer的问题，确保其恢复消费速度，然后将现有consumer都停掉。
②临时建立好原先10倍或者20倍的queue数量(新建一个topic，partition是原来的10倍)。
③然后写一个临时分发消息的consumer程序，这个程序部署上去消费积压的消息，消费之后不做耗时处理，直接均匀轮询写入临时建好分10数量的queue里面。
④紧接着征用10倍的机器来部署consumer，每一批consumer消费一个临时queue的消息。
⑤这种做法相当于临时将queue资源和consumer资源扩大10倍，以正常速度的10倍来消费消息。
⑥等快速消费完了之后，恢复原来的部署架构，重新用原来的consumer机器来消费消息。

2. 消息设置了过期时间，过期就丢了

假设你用的是rabbitmq，rabbitmq是可以设置过期时间的，就是TTL，如果消息在queue中积压超过一定的时间就会被rabbitmq给清理掉，这个数据就没了。那这就是第二个坑了。这就不是说数据会大量积压在mq里，而是大量的数据会直接搞丢。

解决方案：
这种情况下，实际上没有什么消息挤压，而是丢了大量的消息。所以第一种增加consumer肯定不适用。

这种情况可以采取 “批量重导” 的方案来进行解决。
在流量低峰期(比如夜深人静时)，写一个程序，手动去查询丢失的那部分数据，然后将消息重新发送到mq里面，把丢失的数据重新补回来。

3. 积压消息长时间没有处理，MQ放不下了

解决方案：
这个就没有办法了，肯定是第一方案执行太慢，这种时候只好采用 “丢弃+批量重导” 的方式来解决了。

首先，临时写个程序，连接到mq里面消费数据，收到消息之后直接将其丢弃，快速消费掉积压的消息，降低MQ的压力，然后走第二种方案，在晚上夜深人静时去手动查询重导丢失的这部分数据。

二、MQ消息丢失处理

详细请看我的另外一篇文章：引入RabbitMQ后，你如何保证全链路数据100%不丢失？

1. 生产者弄丢了数据

1.使用事务（性能差）
可以选择用rabbitmq提供的事务功能，在生产者发送数据之前开启rabbitmq事务（channel.txSelect），然后发送消息，如果消息没有成功被rabbitmq接收到，那么生产者会收到异常报错，此时就可以回滚事务（channel.txRollback），然后重试发送消息；如果收到了消息，那么可以提交事务（channel.txCommit）。但是问题是，开始rabbitmq事务机制，基本上吞吐量会下来，因为太耗性能。
2.发送回执确认（推荐）
可以开启confirm模式，在生产者那里设置开启confirm模式之后，你每次写的消息都会分配一个唯一的id，然后如果写入了rabbitmq中，rabbitmq会给你回传一个ack消息，告诉你说这个消息ok了。如果rabbitmq没能处理这个消息，会回调你一个nack接口，告诉你这个消息接收失败，你可以重试。而且你可以结合这个机制自己在内存里维护每个消息id的状态，如果超过一定时间还没接收到这个消息的回调，那么你可以重发。

事务机制和cnofirm机制最大的不同在于**，事务机制是同步的**，你提交一个事务之后会阻塞在那儿，但是confirm机制是异步的，你发送个消息之后就可以发送下一个消息，然后那个消息rabbitmq接收了之后会异步回调你一个接口通知你这个消息接收到了。

2. RabbitMQ弄丢了数据-开启RabbitMQ的数据持久化

为了防止rabbitmq自己弄丢了数据，这个你必须开启rabbitmq的持久化，就是消息写入之后会持久化到磁盘，哪怕是rabbitmq自己挂了，恢复之后会自动读取之前存储的数据，一般数据不会丢。除非极其罕见的是，rabbitmq还没持久化，自己就挂了，可能导致少量数据会丢失的，但是这个概率较小。

设置持久化有两个步骤：