当生产者发送消息失败时,RocketMQ 会根据具体情况进行不同的处理,以保证消息的可靠性。
RocketMQ 认为需要重试的场景包括:返回 ConsumeConcurrentlyStatus.RECONSUME_LATER
、返回 null
以及主动或被动抛出异常。
如果消息消费失败,它会被放到重试队列中。重试队列的 Topic 名字为 %RETRY% + consumerGroup
,其中 consumerGroup
是消费者组的名称。
在 Consumer 启动的时候,框架内部会自动订阅这个重试队列,所以重试消息能够被再次消费。并且,消息不是一直重试,而是每隔一段时间进行重试,重试的间隔时间会逐渐增加,具体的间隔时间如下表所示:
重试次数 | 与上次重试的间隔时间 |
---|---|
1 | 10 秒 |
2 | 30 秒 |
3 | 1 分钟 |
4 | 2 分钟 |
5 | 3 分钟 |
6 | 4 分钟 |
7 | 5 分钟 |
8 | 6 分钟 |
9 | 7 分钟 |
10 | 8 分钟 |
11 | 9 分钟 |
12 | 10 分钟 |
13 | 20 分钟 |
14 | 30 分钟 |
15 | 1 小时 |
16 | 2 小时 |
当消息超过最大消费次数(默认 16 次)仍然失败时,会将消息投递到死信队列中。死信队列的 Topic 名为 %DLQ% + consumerGroup
。
因此,当发现消息状态为已消费(CONSUMED)但实际消费失败时,可以去重试队列和死信队列中查找相应的消息。
为了避免消息发送失败,在使用 RocketMQ 时,可以注意以下几点:
- 配置正确的连接参数,包括服务器地址、端口和认证信息(如果需要)。
- 处理网络异常,添加对网络错误的重试或其他适当的处理逻辑。
- 监控生产者与 RocketMQ 服务器之间的连接状态,及时发现并处理连接异常。
- 对于发送的消息,合理设置消息的属性和大小,避免过大的消息导致发送失败。
- 根据业务需求,选择合适的消息发送方式(同步、异步或单向)。例如,对可靠性要求较高的场景可以使用同步发送,并检查返回状态来确保消息发送成功。