RocketMQ常见问题及解决方案

RocketMQ FAQ

1、消费组的消息的消费状态为NOT_CONSUME_YET

可能原因

1)消费端处理消息发生异常没有捕获或是因为其他原因,没有返回消费状态

解决方案:

消费端捕获异常,

如果需要重试,返回ConsumeConcurrentlyStatus.RECONSUME_LATER

如果不需要重试,返回ConsumeConcurrentlyStatus.RECONSUME_SUCCESS

可以在消费端增加重试次数判断,例如重试三次就返回成功

if (msgs.get(0).getReconsumeTimes() == 3) {

// 该条消息可以存储到DB或者LOG日志中,或其他处理方式

return ConsumeConcurrentlyStatus.CONSUME_SUCCESS;// 成功

} else {

return ConsumeConcurrentlyStatus.RECONSUME_LATER;// 重试

}

2)不同的消费者consumer1,、consumer2配置了相同的单个消费组consumerGroup,订阅了多个topic和tags,此种场景下,消费端初始化消费者后,consumer1和consumer2与broker建立心跳连接是,会相互覆盖相同consumerGroup下消费的topic信息,导致部分消息消费不了

解决方案:

建议一个消费组订阅一个topic

若非要一个消费组定于多个topic,也只能初始化一个消费者实例,订阅多个topic和tags组合

eg :

 
DefaultMQPushConsumerconsumer = new DefaultMQPushConsumer("test_group", "secretId", "secretKey");

consumer.subscribe("topicA", "tagA||tagA1");

consumer.subscribe("topicB", "tagB||tagB1");

2、消息堆积

可能原因

1、消费消息速度赶不上生产消息速度

解决方案

消费速度慢的处理方式

1 提高消费并行度

绝大部分消息消费行为都属于 IO 密集型,即可能是操作数据库,或者调用 RPC,这类消费行为的消费速度在于后端数据库或者外系统的吞吐量,通过增加消费并行度,可以提高总的消费吞吐量,但是并行度增加到一定程度,反而会下降。所以,应用必须要设置合理的并行度。 如下有几种修改消费并行度的方法:

  • 同一个 ConsumerGroup 下,通过增加 Consumer 实例数量来提高并行度(需要注意的是超过订阅队列数的 Consumer 实例无效)。可以通过加机器,或者在已有机器启动多个进程的方式。
  • 提高单个 Consumer 的消费并行线程,通过修改参数 consumeThreadMin、consumeThreadMax实现。

2 批量方式消费

某些业务流程如果支持批量方式消费,则可以很大程度上提高消费吞吐量,例如订单扣款类应用,一次处理一个订单耗时 1 s,一次处理 10 个订单可能也只耗时 2 s,这样即可大幅度提高消费的吞吐量,通过设置 consumer的 consumeMessageBatchMaxSize 返个参数,默认是 1,即一次只消费一条消息,例如设置为 N,那么每次消费的消息数小于等于 N。

3 跳过非重要消息

发生消息堆积时,如果消费速度一直追不上发送速度,如果业务对数据要求不高的话,可以选择丢弃不重要的消息。例如,当某个队列的消息数堆积到100000条以上,则尝试丢弃部分或全部消息,这样就可以快速追上发送消息的速度。示例代码如下:

 
public ConsumeConcurrentlyStatus consumeMessage(

    List<MessageExt> msgs,

    ConsumeConcurrentlyContext context) {

    long offset = msgs.get(0).getQueueOffset();

    String maxOffset =

    msgs.get(0).getProperty(Message.PROPERTY_MAX_OFFSET);

    long diff = Long.parseLong(maxOffset) - offset;

    if (diff > 100000) {

        // TODO 消息堆积情况的特殊处理

        return ConsumeConcurrentlyStatus.CONSUME_SUCCESS;

    }

    // TODO 正常消费过程

    return ConsumeConcurrentlyStatus.CONSUME_SUCCESS;

}

4 优化每条消息消费过程

举例如下,某条消息的消费过程如下:

  • 根据消息从 DB 查询【数据 1】
  • 根据消息从 DB 查询【数据 2】
  • 复杂的业务计算
  • 向 DB 插入【数据 3】
  • 向 DB 插入【数据 4】

这条消息的消费过程中有4次与 DB的 交互,如果按照每次 5ms 计算,那么总共耗时 20ms,假设业务计算耗时 5ms,那么总过耗时 25ms,所以如果能把 4 次 DB 交互优化为 2 次,那么总耗时就可以优化到 15ms,即总体性能提高了 40%。所以应用如果对时延敏感的话,可以把DB部署在SSD硬盘,相比于SCSI磁盘,前者的RT会小很多。

3、消费组不在线 NOT_ONLINE

可能原因

1)消费者未启动

解决方案

启动消费者服务

2)网络未打通,可使用telnet命令测试,ping命令可能会不准确(服务器可能会禁ping)

解决方案

联系运维打通网络

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
当使用 RocketMQ 时,消息丢失可能是由多种原因引起的。以下是一些常见的消息丢失问题和解决方案: 1. 生产者发送失败:如果生产者在发送消息时遇到异常或错误,消息可能会丢失。为了解决这个问题,可以在生产者端实现重试机制,确保消息成功发送到 RocketMQ。此外,可以检查日志和错误信息,以确定发送失败的具体原因。 2. 消费者处理失败:如果消费者在处理消息时发生错误,并且没有实现消息重试或异常处理机制,那么消息可能会被认为是已经消费,但实际上并未成功处理。为了解决这个问题,建议在消费者端实现消息的幂等性和异常处理机制,以确保消息的可靠消费。 3. 消费者负载过高:如果消费者的负载过高,消费速度无法跟上消息的到达速度,那么部分消息可能会被丢弃。为了解决这个问题,可以增加消费者的数量,或者调整消费者的线程池大小来提高消费速度。 4. 消息存储配置不正确:RocketMQ 提供了两种消息存储方式,分别是同步刷盘和异步刷盘。如果配置为同步刷盘模式,并且消息发送量很大,可能会导致消息发送的性能下降,并且有可能出现消息丢失的情况。为了解决这个问题,可以将消息存储配置为异步刷盘模式,以提高消息发送的性能和可靠性。 5. 网络问题:如果网络不稳定或者存在丢包问题,可能会导致消息丢失。为了解决这个问题,可以检查网络连接和配置,确保网络稳定性和可靠性。 总结: 要解决 RocketMQ 中的消息丢失问题,可以采取以下措施:实现生产者的重试机制、消费者的幂等性和异常处理机制、增加消费者数量、调整消息存储配置、检查网络连接和配置。根据具体的场景和问题,还可以进行更深入的排查和调优。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值