同一个消费组内的消费者,如果订阅了相同的Topic,但是订阅的tag不相同,会出现消息丢失问题。
原因:RocketMQ要求同一个消费组里的消费者必须订阅关系一致,若订阅关系不一致将会发生消息丢失。
什么是订阅关系不一致?
订阅关系一致是指同一个消费组下的所有消费者所订阅的Topic、Tag必须完全一致。如下图:
其中,消费组 1 中的消费组都订阅了 Topic1 中的 Tag1,消费组 2 中的消费组都订阅了 Topic1 中的所有 Tag 以及 Topic2 中的 Tag1 || Tag2,消费组 3 中的消费组都订阅了 Topic2 中的 Tag1 和 Tag2。
订阅关系不一致的例子,如下图:
情况一:消费组 1 的 Consumer1 和 Consumer2 都订阅了 Topic1,但是订阅的 Tag 不一致。
情况二:消费组 2 的 Consumer1 和 Consumer2 订阅的Topic不一致。
情况三:消费组 3 Consumer1 和 Consumer2 订阅的 Topic 和 Tag 都一致,但是订阅 Tag 的顺序不一致。
为何订阅关系不一致会导致消息丢失?
RocketMQ 的存储架构图,如下图所示:
为了 提高消费效率,RocketMQ 引入了 ConsumeQueue,ConsumerQueue 中保存消息在 CommitLog 文件中的物理偏移量。ConsumerQueue 中的元素内容如下:
前 8 个字节记录消息在 CommitLog 中的偏移量。
中间 4 个字节记录消息消息大小。
最后 8 个字节记录消息中 tag 的 hashcode。
这个 tag 的作用是过滤消息,假如一个 Consumer 订阅了 Topic1 中的 Tag1,那这个 Consumer 拉取消息时,首先从 Name Server 获取订阅关系,得到当前 Consumer 订阅的所有 tag 的 hashcode 集合 codeSet。每次从 ConsumerQueue 获取一条记录,就要判断最后 8 个字节 tag hashcode 是否在 codeSet 中,比如 Tag2 不在 codeSet 中,就会被过滤掉。如下图:
消费组 1 消费 Topic1 中的消息时,Consumer1 通过 ConsumeQueue1 和 ConsumeQueue2 进行消费,Consumer2 通过 ConsumeQueue3 和 ConsumeQueue4 进行消费,如果 Consumer1 订阅了 Tag1, Consumer2 订阅了 Tag2,那 Consumer1 从 ConsumeQueue1 和 ConsumeQueue2 消费消息时,就会把 Tag2 中的消息过滤掉,这样即使 Consumer2 订阅了 Tag2,也不能消费到 ConsumeQueue1 和 ConsumeQueue2 里 Tag2 中的消息了。
有没有方法可以快速知道消费组中有没有订阅关系不一致的问题?
可以在 RocketMQ 的控制台看到。在 RocketMQ 的实例列表中,进入 Group 管理页面,查看要查找的 Group ID,查看详情,如下图:(下图来自阿里云)
转自:Hollis微信公众号