RocketMq消息积压、消息重复、消息完整、消息顺序处理方案

消息积压

当生产端的生产效率大于消费端的消费效率,就会造成消息处理不完的情况。

排查方式:RocketMQ 监控告警:生产环境如何快速通过监控预警发现堆积、收发失败等问题?_rocketmq监控指标_阿里云云原生的博客-CSDN博客

处理方案:

消费端水平扩容,

1、如果Topic下的分配的队列足够多,集群中新增Consummer节点来消费。最极限的情况是把Consumer的节点个数设置成跟队列的个数相同。超过的情况没有意义,一个consumer同步消费一条队列。

2、如果Topic下的分配的队列不够的情况。

        2-1、新增一个topic,并且分配更多的队列,并且把旧的topic的消息转存到新的Topic中,新增更多的Consumer进行消费队列(Consumer数量==队列的数量)。

        2-2、旧的topic,可以再分配一个新的consumer去消费。

     

消息重复

原因:

1、发送时消息重复: 当一条消息已被成功发送到服务端并完成持久化,此时出现了网络闪断或者客户端宕机,导致服务端对客户端应答失败。 如果此时生产者意识到消息发送失败并尝试再次发送消息,消费者后续会收到两条内容相同并且 Message ID 也相同的消息。


2、投递时消息重复: 消息消费的场景下,消息已投递到消费者并完成业务处理,当客户端给服务端反馈应答的时候网络闪断。 为了保证消息至少被消费一次,消息队列 RocketMQ 的服务端将在网络恢复后再次尝试投递之前已被处理过的消息,消费者后续会收到两条内容相同并且 Message ID 也相同的消息。


3、负载均衡时消息重复(包括但不限于网络抖动、Broker 重启以及订阅方应用重启): 当消息队列 RocketMQ 的 Broker 或客户端重启、扩容或缩容时,会触发 Rebalance,此时消费者可能会收到重复消息。
 

解决方案:

1、使用数据库的唯一约束实现幂等,比如对于数据插入类的场景,比如创建订单,因为订单号肯定是唯一的,所以如果是多次调用就会触发数据库的唯一约束异常,从而避免一个请求创建多个订单的问题。

2、使用redis里面提供的setNX指令,比如对于MQ消费的场景,为了避免MQ重复消费导致数据多次被修改的问题,可以在接受到MQ的消息时,把这个消息通过setNx写入到redis里面,一旦这个消息被消费过,就不会再次消费。
 

消息完整(不丢失):

producer端(发送端):

  • 同步发送
  • 异步发送
  • 单向发送

        1、producer端由默认的异步机制改为实时的同步机制,producer端就可以实时知道消息的发送结果。
        2、可以实现异步回调来监听消息发送的结果,如果发送失败,可以在回调中重试。
        3、 使用producer的重试机制,没发送成功就再发送一次。

broker端(存储端):

  • 同步刷盘:生产者消息发过来时,只有持久化到磁盘,RocketMQ 存储端Broker 才返回一个成功ACK 响应。它保证消息不丢失,但影响了性能。
  • 异步刷盘:只要消息写入 PageCache 缓存,就返回一个成功 ACK 响应。这样提高了 MQ 性能,但如果这时候机器断电了,就会丢失消息。

       1、 异步批量刷盘机制,按照一定消息量和时间间隔去刷盘。这个是由操作系统本身去决定,如果刷盘之前系统崩溃了,才会导致消息丢失。针对这种崩溃场景:需要通过partition的副本机制和ack机制来解决。

        Broker 一般集群部署,有主节点和从节点。消息到 Broker 存储端,只有主节点和从节点都写入成功,才反馈成功ack 给生产者。这就同步复制,它保证了消息不丢失,但降低了系统吞吐量。与之对应即异步复制,只要消息写入主节点成功,就返回成功ack,它速度快,但会有性能问题。

 cusumer端(消费端): 

        消费者执行完业务逻辑,再反馈会 Broker 说消费成功,这样才可以保证消费阶段不丢消息,调整offset即可。

事务消息

  1. 生产者产生消息,发送一条半事务消息到 MQ 服务器
  2. MQ 收到消息后,将消息持久化到存储系统,这条消息✁状态✁待发送状态。
  3. MQ 服务器返回 ACK 确认到生产者,此时 MQ 不会触发消息推送事件
  4. 生产者执行本地事务
  5. 如果本地事务执行成功,即 commit 执行结果到 MQ 服务器;如果执行失败,发送rollback。
  6. 如果正常commit,MQ 服务器更新消息状态为可发送;如果rollback,即删除消息。
  7. 如果消息状态更新为可发送,则 MQ 服务器会 push 消息给消费者。消费者消费完就回ACK。
  8. 如果 MQ 服务器长时间没有收到生产者commit 或者rollback,它会反查生产者,然后根据查询到结果执行最终状态。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
DDMQ 是滴滴出行架构部基于 Apache RocketMQ 构建的消息队列产品。作为分布式消息中间件,DDMQ 为滴滴出行各个业务线提供了低延迟、高并发、高可用、高可靠的消息服务。DDMQ 提供了包括实时消息、延迟消息和事务消息在内的多种消息类型以满足不同的业务需求。 用户通过统一的 Web 控制台和傻瓜式的 SDK 即可轻松接入 DDMQ 生产和消费消息,体验功能丰富、稳定的消息服务。 主要功能特性: 1、消息模型:支持 P2P, Pub/Sub 等消息模型 2、海量消息存储,支持消息回溯:使用 RocketMQ 和 Kafka 作为消息的底层存储引擎。 3、低延迟高吞吐:毫秒级延迟,单机百万条消息吞吐。 4、延迟消息:单条消息设置精确到秒级的延迟时间,支持 Thrift、HTTP 形式的回调接口。提供了丰富的消息类型,包括延迟消息和循环延迟消息。 5、事务消息: 提供类似 X/Open XA 的分布事务功能,通过 DDMQ 事务消息能够达到分布式事务的最终一致。 6、多语言客户端: 提供了主流开发语言的 SDK,包括 PHP, Java, Go, C/C++, Python 等。API 上保持着最易使用的 High Level 形式。 7、支持复杂的消息转换过滤功能:支持使用 Groovy 脚本在服务端进行消息内容的转化和过滤,能做大大地减少客户端和服务器的数据传输,同时减少客户端的处理消息的负载。 8、提供了一个易用性高的 Web 用户控制台,方便用户在控制台上申请 Topic, ConsumerGroup, Subscription 等资源。 提供消费进度的查看和重置功能。 模块介绍: carrera-common 提供其他模块的公共代码,封装了 ZK 操作。 carrera-producer 生产消息代理模块,内置 Thrift Server, 负责将 client 的生产的消息转发给 broker。 carrera-consumer 消费消息代理模块, 内置 Thrift Server, 提供 SDK 拉取和 HTTP 推送等方式将消息发给订阅方。 carrera-chronos 延迟消息模块,使用 RocksDB 作为延迟消息的存储引擎。 carrera-sdk 生产和消费消息的 SDK 代码, 支持 Java/C/C++/Go/PHP/Python 等主流语言。 rocketmq 基于开源 RocketMQ 修改(版本 4.2.0),增加了 broker 主从自动切换等特性。 carrera-console 基于 Spring 开发的用户控制台,管理配置。 carrera-monitor 监控模块,提供消费积压监控和集群健康监控。 carrera-docker 提供单机版的 DDMQ 镜像,方便部署和使用。 外部依赖: 64bit OS, Linux/Unix/Mac 64bit JDK 1.8+ Maven 3.2.x MySQL 5.7.x Tomcat 7/8/9 Zookeeper 3.4.x

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值