【RabbitMQ篇】消息堆积/丢失 解决办法

一、MQ消息堆积处理

1. 临时扩容,以更快的速度去消费数据

解决方案:
这种时候只能操作临时扩容,以更快的速度去消费数据了。具体操作步骤和思路如下:

  • ①先修复consumer的问题,确保其恢复消费速度,然后将现有consumer都停掉。

  • ②临时建立好原先10倍或者20倍的queue数量(新建一个topic,partition是原来的10倍)。

  • ③然后写一个临时分发消息的consumer程序,这个程序部署上去消费积压的消息,消费之后不做耗时处理,直接均匀轮询写入临时建好分10数量的queue里面。

  • ④紧接着征用10倍的机器来部署consumer,每一批consumer消费一个临时queue的消息。

  • ⑤这种做法相当于临时将queue资源和consumer资源扩大10倍,以正常速度的10倍来消费消息。

  • ⑥等快速消费完了之后,恢复原来的部署架构,重新用原来的consumer机器来消费消息。

2. 消息设置了过期时间,过期就丢了

假设你用的是rabbitmq,rabbitmq是可以设置过期时间的,就是TTL,如果消息在queue中积压超过一定的时间就会被rabbitmq给清理掉,这个数据就没了。那这就是第二个坑了。这就不是说数据会大量积压在mq里,而是大量的数据会直接搞丢。

解决方案:
这种情况下,实际上没有什么消息挤压,而是丢了大量的消息。所以第一种增加consumer肯定不适用。

这种情况可以采取 “批量重导” 的方案来进行解决。
在流量低峰期(比如夜深人静时),写一个程序,手动去查询丢失的那部分数据,然后将消息重新发送到mq里面,把丢失的数据重新补回来。

3. 积压消息长时间没有处理,MQ放不下了

解决方案:
这个就没有办法了,肯定是第一方案执行太慢,这种时候只好采用 “丢弃+批量重导” 的方式来解决了。

首先,临时写个程序,连接到mq里面消费数据,收到消息之后直接将其丢弃,快速消费掉积压的消息,降低MQ的压力,然后走第二种方案,在晚上夜深人静时去手动查询重导丢失的这部分数据。


二、MQ消息丢失处理

详细请看我的另外一篇文章:引入RabbitMQ后,你如何保证全链路数据100%不丢失?

1. 生产者弄丢了数据

  • 1.使用事务(性能差)
    可以选择用rabbitmq提供的事务功能,在生产者发送数据之前开启rabbitmq事务(channel.txSelect),然后发送消息,如果消息没有成功被rabbitmq接收到,那么生产者会收到异常报错,此时就可以回滚事务(channel.txRollback),然后重试发送消息;如果收到了消息,那么可以提交事务(channel.txCommit)。但是问题是,开始rabbitmq事务机制,基本上吞吐量会下来,因为太耗性能。

  • 2.发送回执确认(推荐)
    可以开启confirm模式,在生产者那里设置开启confirm模式之后,你每次写的消息都会分配一个唯一的id,然后如果写入了rabbitmq中,rabbitmq会给你回传一个ack消息,告诉你说这个消息ok了。如果rabbitmq没能处理这个消息,会回调你一个nack接口,告诉你这个消息接收失败,你可以重试。而且你可以结合这个机制自己在内存里维护每个消息id的状态,如果超过一定时间还没接收到这个消息的回调,那么你可以重发。

事务机制和cnofirm机制最大的不同在于**,事务机制是同步的**,你提交一个事务之后会阻塞在那儿,但是confirm机制是异步的,你发送个消息之后就可以发送下一个消息,然后那个消息rabbitmq接收了之后会异步回调你一个接口通知你这个消息接收到了。

2. RabbitMQ弄丢了数据-开启RabbitMQ的数据持久化

为了防止rabbitmq自己弄丢了数据,这个你必须开启rabbitmq的持久化,就是消息写入之后会持久化到磁盘,哪怕是rabbitmq自己挂了,恢复之后会自动读取之前存储的数据,一般数据不会丢。除非极其罕见的是,rabbitmq还没持久化,自己就挂了,可能导致少量数据会丢失的,但是这个概率较小。

设置持久化有两个步骤:

  • 第一个是创建queue的时候将其设置为持久化的,这样就可以保证rabbitmq持久化queue的元数据,但是不会持久化queue里的数据;
  • 第二个是发送消息的时候将消息的deliveryMode设置为2,就是将消息设置为持久化的,此时rabbitmq就会将消息持久化到磁盘上去。

必须要同时设置这两个持久化才行,rabbitmq哪怕是挂了,再次重启,也会从磁盘上重启恢复queue,恢复这个queue里的数据。

而且持久化可以跟生产者那边的confirm机制配合起来,只有消息被持久化到磁盘之后,才会通知生产者ack了,所以哪怕是在持久化到磁盘之前,rabbitmq挂了,数据丢了,生产者收不到ack,你也是可以自己重发的

若生产者那边的confirm机制未开启的情况下,哪怕是你给rabbitmq开启了持久化机制,也有一种可能,就是这个消息写到了rabbitmq中,但是还没来得及持久化到磁盘上,结果不巧,此时rabbitmq挂了,就会导致内存里的一点点数据会丢失。

3. 消费端弄丢了数据

主要是因为你消费的时候,刚消费到,还没处理,结果进程挂了比如重启了,那么就尴尬了,RabbitMQ认为你都消费了,这数据就丢了。或者消费者拿到数据之后挂了,这时候需要MQ重新指派另一个消费者去执行任务(一块肉,刚用筷子夹起来,发地震抖了一下,肉掉了)

这个时候得**用RabbitMQ提供的ack机制,也是一种处理完成发送回执确认的机制。**如果MQ等待一段时间后你没有发送过来处理完成 那么RabbitMQ就认为你还没处理完,这个时候RabbitMQ会把这个消费分配给别的consumer去处理,消息是不会丢的。


三、mq消息重复发送的避免

最简单的解决方案是每条消费记录有个消费状态字段,根据这个消费状态字段来是否消费或者使用一个集中式的表,来存储所有消息的消费状态,从而避免重复消费

  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
RabbitMQ 消息堆积是指未能及时消费的消息在队列中积累形成的现象。当消息的生产速度大于消费速度时,就会导致消息堆积消息堆积可能会带来以下问题: 1. 系统负载增加:随着消息堆积的增加,队列中的消息数量也会增加,导致系统的内存和存储资源占用增加,可能会影响系统的整体性能。 2. 延迟增加:消息堆积会导致消费者无法及时处理消息,从而增加消息的等待时间,延迟了消息的传递和处理。 3. 消息丢失风险:如果队列堆积消息超过队列的最大容量限制,新到达的消息可能会被丢弃或拒绝接收。这可能会导致消息丢失,造成数据的不一致性。 为了解决消息堆积的问题,可以考虑以下几个方面: 1. 调整消费者的处理能力:增加消费者的数量或者调整消费者的处理速度,以提高消息的消费能力。 2. 增加队列的容量:通过增加队列的最大容量限制,可以减少消息堆积的风险。然而,需要注意设置合理的队列容量,避免过大的队列带来的资源消耗和延迟增加。 3. 监控和预警:实时监控消息队列的堆积情况,并设置合适的预警机制,一旦消息堆积达到一定阈值,及时采取措施进行处理。 4. 消息重试和死信队列:当消费者处理消息失败时,可以将消息重新放回队列进行重试。如果消息重试多次仍然失败,可以将消息发送到死信队列进行后续处理。 总之,消息堆积RabbitMQ 中常见的问题,通过合理调整消费者的处理能力、增加队列容量、监控和预警等措施,可以有效应对和解决消息堆积带来的影响。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

_Romeo

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值