RocketMQ高级特性总结

最新推荐文章于 2024-07-13 10:25:34 发布

猿华

最新推荐文章于 2024-07-13 10:25:34 发布

阅读量411

点赞数

分类专栏： MQ消息队列文章标签： java-rocketmq rocketmq 中间件

本文链接：https://blog.csdn.net/m0_52255061/article/details/125584623

版权

MQ消息队列专栏收录该内容

3 篇文章 0 订阅

订阅专栏

RocketMQ高级特性总结

消息存储

何时存储消息

一般这种中间件都需要保证可靠性；可靠性就涉及到了数据的存储和持久化；就像redis;虽说数据存在内存中；但是也做了持久化备份，并且还是两种方案；可见，作为中间件数据的持久化是不可避免的！那么rock是怎么来处理的呢？

答案是：文件存储！那么有人可能就会说了，文件存储？那不慢的要死？其实并不慢，下面会有介绍！

MQ收到一条消息后，需要向生产者返回一个ACK响应，并将消息存储起来。
MQ Push一条消息给消费者后，等待消费者的ACK响应，需要将消息标记为已消费。如果没有标记为消费，MQ会不断的尝试往消费者推送这条消息。
MQ需要定期删除一些过期的消息，这样才能保证服务一直可用。

消息存储介质

文件存储！不需要借助mysql等索引数据库；

文件存储的速度问题？

高性能的磁盘顺序写的速度很快；比随机写快6000倍！完全不用担心；

Rocket就是使用顺序写，保证了消息存储的速度；

另外！

零拷贝技术加快文件读写

原始数据读写：

App read数据；文件先从内核态复制到用户态中，再由程序读取到自己的工作空间；

乍一看；就觉得慢！

这两个看似简单的操作，实际进行了4 次数据复制，分别是：

从磁盘复制数据到内核态内存；
从内核态内存复制到用户态内存；
然后从用户态内存复制到网络驱动的内核态内存；
最后是从网络驱动的内核态内存复制到网卡中进行传输。

mmap机制：mmap操作提供了一种机制，让用户程序直接访问设备内存，这种机制，相比较在用户空间和内核空间互相拷贝数据，效率更高。在要求高性能的应用中比较常用。mmap映射内存必须是页面大小的整数倍，面向流的设备不能进行mmap，mmap的实现和硬件有关。

而通过使用mmap的方式，可以省去向用户态的内存复制，提高速度。这种机制在Java中是通过NIO包中的MappedByteBuffer实现的。RocketMQ充分利用了上述特性，也就是所谓的“零拷贝”技术，提高消息存盘和网络发送的速度。

这里需要注意的是，采用MappedByteBuffer这种内存映射的方式有几个限制，其中之一是一次只能映射1.5~2G 的文件至用户态的虚拟内存，这也是为何RocketMQ默认设置单个CommitLog日志数据文件为1G的原因了

关于零拷贝，JAVA的NIO中提供了两种实现方式，mmap和sendfile，其中mmap适合比较小的文件，而sendfile适合传递比较大的文件。同学们自行回顾下这部分的内容。

消息存储结构

消息知道是如何存储的了，那么他的具体存储结构式什么样的呢？官方图：

首先：生产者发送消息到commitlog这个存储结构；再由commitlog将消息分发建立索引，通过tag分发建立的索引交consumerqueue消息逻辑队列；再通过其他条件分发到index索引文件；这样用户就可以根据条件进行消息的过滤！消息逻辑队列就可通过tag进行过滤，而index就可以通过sql进行过滤查找消息的具体位置！

总结：

CommitLog：存储消息的元数据。所有消息都会顺序存入到CommitLog文件当中。CommitLog由多个文件组成，每个文件固定大小1G。以第一条消息的偏移量为文件名。
ConsumerQueue：存储消息在CommitLog的索引。一个MessageQueue一个文件，记录当前MessageQueue被哪些消费者组消费到了哪一条CommitLog。
IndexFile：为了消息查询提供了一种通过key或时间区间来查询消息的方法，这种通过IndexFile来查找消息的方法不影响发送与消费消息的主流程

刷盘机制

总所周知；内存断电即失；所以rocketmq需要将数据同步到磁盘；如何同步呢？分为同步刷盘和异步刷盘；

同步：很容易理解，生产者将消息提交到commitlog,commitlog将数据写入磁盘文件，成功后将结果返回；效率不高！

异步：为了提高效率；commitlog接受到消息之后就返回结果了，后续的刷盘任务就交给其他线程去完成不就好了！commitlog再收到消息之后；零食存储到一个buff中；后台异步定时任务去同步就行了；当然这样做快到是快了；会有数据丢失的风险！

主从复制

broker可以配置主从；从借点目的只负责数据的备份；那这就涉及到的主从复制的问题；需要将消息从master复制到slave上，复制的方式也有两种；同步异步；

同步复制：

同步复制是等Master和Slave都写入消息成功后才反馈给客户端写入成功的状态。

在同步复制下，如果Master节点故障，Slave上有全部的数据备份，这样容易恢复数据。但是同步复制会增大数据写入的延迟，降低系统的吞吐量。

异步复制：

异步复制是只要master写入消息成功，就反馈给客户端写入成功的状态。然后再异步的将消息复制给Slave节点。

在异步复制下，系统拥有较低的延迟和较高的吞吐量。但是如果master节点故障，而有些数据没有完成复制，就会造成数据丢失。

配置方式：

消息复制方式是通过Broker配置文件里的brokerRole参数进行设置的，这个参数可以被设置成ASYNC_MASTER、 SYNC_MASTER、SLAVE三个值中的一个。

负载均衡

有集群的地方就必然有敷在均衡！

生产者负载均衡：

很简单！往同一个topic下面的messagequeue发消息的时候采用递增取模的方式让消息平均落在队列上！

在顺序消息场景；需要指定一个MessageQueueSelector。通过这个对象来将消息发送到自己指定的MessageQueue上。这样可以保证消息局部有序；

消费者负载均衡！

在集群消费模式下，每条消息只需要投递到订阅这个topic的Consumer Group下的一个实例即可。RocketMQ采用主动拉取的方式拉取并消费消息，在拉取的时候需要明确指定拉取哪一条message queue。

而每当实例的数量有变更，都会触发一次所有实例的负载均衡，这时候会按照queue的数量和实例的数量平均分配queue给每个实例。

每次分配时，都会将MessageQueue和消费者ID进行排序后，再用不同的分配算法进行分配。内置的分配的算法共有六种，分别对应AllocateMessageQueueStrategy下的六种实现类，可以在consumer中直接set来指定。默认情况下使用的是最简单的平均分配策略。

AllocateMachineRoomNearby：将同机房的Consumer和Broker优先分配在一起。

这个策略可以通过一个machineRoomResolver对象来定制Consumer和Broker的机房解析规则。然后还需要引入另外一个分配策略来对同机房的Broker和Consumer进行分配。一般也就用简单的平均分配策略或者轮询分配策略。

消息重试

消息消费失败后希望再重试一遍；但不会让生产者重发一次，这显然不合逻辑！所以，消息消费失败之后会根据需求进入重试队列；rocket会自动创建以 %RETRY% 为前缀的重试队列进行重试！

重试次数默认为16次，如果超过了的话就会转为死信队列！

死信队列

重试次数超过的消息都不会丢弃，而是放到一个死信队列里面！死信队列需要人工干预才能正常使用；不然知识存储而已！

死信队列的特征：

一个死信队列对应一个ConsumGroup，而不是对应某个消费者实例。
如果一个ConsumeGroup没有产生死信队列，RocketMQ就不会为其创建相应的死信队列。
一个死信队列包含了这个ConsumeGroup里的所有死信消息，而不区分该消息属于哪个Topic。
死信队列中的消息不会再被消费者正常消费。
死信队列的有效期跟正常消息相同。默认3天，对应broker.conf中的fileReservedTime属性。超过这个最长时间的消息都会被删除，而不管消息是否消费过。

通常，一条消息进入了死信队列，意味着消息在消费处理的过程中出现了比较严重的错误，并且无法自行恢复。此时，一般需要人工去查看死信队列中的消息，对错误原因进行排查。然后对死信消息进行处理，比如转发到正常的Topic重新进行消费，或者丢弃。

注：默认创建出来的死信队列，他里面的消息是无法读取的，在控制台和消费者中都无法读取。这是因为这些默认的死信队列，他们的权限perm被设置成了2:禁读(这个权限有三种 2:禁读，4:禁写,6:可读可写)。需要手动将死信队列的权限配置成6，才能被消费(可以通过mqadmin指定或者web控制台)。

消息幂等

1、幂等的概念

在MQ系统中，对于消息幂等有三种实现语义：

at most once 最多一次：每条消息最多只会被消费一次
at least once 至少一次：每条消息至少会被消费一次
exactly once 刚刚好一次：每条消息都只会确定的消费一次

这三种语义都有他适用的业务场景。

其中，at most once是最好保证的。RocketMQ中可以直接用异步发送、sendOneWay等方式就可以保证。

而at least once这个语义，RocketMQ也有同步发送、事务消息等很多方式能够保证。

而这个exactly once是MQ中最理想也是最难保证的一种语义，需要有非常精细的设计才行。RocketMQ只能保证at least once，保证不了exactly once。所以，使用RocketMQ时，需要由业务系统自行保证消息的幂等性。

关于这个问题，官网上有明确的回答：

4. Are messages delivered exactly once?

RocketMQ ensures that all messages are delivered at least once. In most cases, the messages are not repeated.

2、消息幂等的必要性

在互联网应用中，尤其在网络不稳定的情况下，消息队列 RocketMQ 的消息有可能会出现重复，这个重复简单可以概括为以下情况：

发送时消息重复

当一条消息已被成功发送到服务端并完成持久化，此时出现了网络闪断或者客户端宕机，导致服务端对客户端应答失败。如果此时生产者意识到消息发送失败并尝试再次发送消息，消费者后续会收到两条内容相同并且 Message ID 也相同的消息。
投递时消息重复

消息消费的场景下，消息已投递到消费者并完成业务处理，当客户端给服务端反馈应答的时候网络闪断。为了保证消息至少被消费一次，消息队列 RocketMQ 的服务端将在网络恢复后再次尝试投递之前已被处理过的消息，消费者后续会收到两条内容相同并且 Message ID 也相同的消息。
负载均衡时消息重复（包括但不限于网络抖动、Broker 重启以及订阅方应用重启）

当消息队列 RocketMQ 的 Broker 或客户端重启、扩容或缩容时，会触发 Rebalance，此时消费者可能会收到重复消息。

3、处理方式

从上面的分析中，我们知道，在RocketMQ中，是无法保证每个消息只被投递一次的，所以要在业务上自行来保证消息消费的幂等性。

而要处理这个问题，RocketMQ的每条消息都有一个唯一的MessageId，这个参数在多次投递的过程中是不会改变的，所以业务上可以用这个MessageId来作为判断幂等的关键依据。

但是，这个MessageId是无法保证全局唯一的，也会有冲突的情况。所以在一些对幂等性要求严格的场景，最好是使用业务上唯一的一个标识比较靠谱。例如订单ID。而这个业务标识可以使用Message的Key来进行传递。

猿华

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
RocketMQ高级特性总结

文件存储？那不慢的要死？其实并不慢，下面会有介绍！文件存储！不需要借助mysql等索引数据库；高性能的磁盘顺序写的速度很快；比随机写快6000倍！完全不用担心；Rocket就是使用顺序写，保证了消息存储的速度；另外！原始数据读写：App read数据；文件先从内核态复制到用户态中，再由程序读取到自己的工作空间；乍一看；就觉得慢！这两个看似简单的操作，实际进行了4 次数据复制，分别是：mmap机制：mmap操作提供了一种机制，让用户程序直接访问设备内存，这种机制，相比较...
复制链接

扫一扫

专栏目录