RocketMQ初识_rocketmq messageid

2401_87299814

于 2024-09-22 20:42:14 发布

阅读量746

点赞数 11

文章标签： rocketmq

本文链接：https://blog.csdn.net/2401_87299814/article/details/142443336

版权

kafka-consumer-groups.bat --bootstrap-server {{ip}}:9092 --describe --group cosumerGroup1

current-offset：当前消费组的已消费偏移量
log-end-offset：主题对应分区消息的结束偏移量
lag：当前消费组未消费的消息数

发现current-offset 远大于 log-end-offset，且lag为负数。

这里即为问题关键，最后了解发现测试回滚了环境，但是没有删除Kafka中的消费者组已消费消息记录，然后继续升级了环境，导致现象像是当前消费者组超前消费了消息。

当再来一条消息时，对应分区中消息的结束偏移量+2，已消费偏移量不变。
那么当消息足够多达到current-offset时，消费者组是否能重新消费消息呢？这个未曾验证。

分布式消息队列（RocketMQ）

第一章 RocketMQ概述

一、MQ概述

1. MQ简介

MQ（Message Queue）消息队列，是基础数据结构中“先进先出”的一种数据结构。它也是一种提供消息队列服务的中间件，也称消息中间件，是一套提供了消息生产、存储、消费全过程API的软件系统。

2. MQ用途

总结为三点：解耦、异步、削峰

3. 常见MQ

ActiveMQ、RabbitMQ、Kafka、RocketMQ

4. MQ常见协议

4.1 JMS（Java Message Service）

JMS，JMS即Java消息服务应用程序接口，是一个Java平台中关于面向消息中间件（MOM）的API，用于在两个应用程序之间，或分布式系统中发送消息，进行异步通信。ActiveMQ是该协议的典型实现。

4.2 STMOP（Streaming Text Orientated Message Protocol）

STMOP是一种为MOM(Message Oriented Middleware,面向消息的中间件)设计的简单文本协议。提供可操作的连接格式，允许客户端与任意STMOP消息代理进行交互。ActiveMQ是该协议的典型实现，RabbitMQ通过插件可支持该协议。

4.3 AMQP（Advanced Message Queuing Protocol）

AMQP是高级消息队列协议，一个提供统一消息服务的应用层标准，是应用层协议的一个开放标准，是一种MOM设计，基于此协议的客户端与消息中间件可传递消息，并不受客户端中间件不同产品、不同开发语言等条件的限制。RabbitMQ是其典型实现。

4.4 MQTT（Message Queuing Telemetry Transport）

它是IBM开发的一个即时通信协议，是一种二进制协议，主要用于服务器和低功耗IoT（Internet of Things，物联网）设备的通信。该协议支持所有平台，几乎可以把所有联网物品和外部连接起来，被用来当作传感器和驱动器的通信协议，RabbitMQ通过插件可以支持该协议。

二、RocketMQ概述

阿里巴巴开源的消息中间件。
官网：https://rocketmq.apache.org/

1. RocketMQ发展史

2001 年，阿里内部适应淘宝 B2C 启动 “五彩石项目”

2011 年，阿里为满足内部顺序消息、海量消息堆积、完全自主控制消息队列，弃用 Apache ActiveMQ，创建 MetaQ。同年，LinkedIn 将 kafka 开源

2012 年，阿里参考 kafka 基于 MetaQ，研发消息队列引擎 RocketMQ

2016 年，阿里将 RocketMQ 捐献给 Apache 基金会，2017 年 9 月，RocketMQ 成为 Apache 顶级项目（国内首个互利网中间件在 Apache 的顶级项目）

第二章 RocketMQ基本概念

一、基本概念

1. 消息（Message）

消息系统所传输信息的物理载体，生产和消费数据的最小单位，每条消息必须属于一个主题。

2. 主题（Topic）

主题是一个逻辑上的概念,它还可以细分为多个分区,一个分区只属于单个主题,很多时候也会把分区称为主题分区(Topic-Partition)。

3. 标签（Tags）

Topic是消息的一级分类，Tag是消息的二级分类。例如，

Topic	Tag
货物	上海
货物	江苏
货物	武汉

4. 队列（Queue）

存储消息的物理实体，一个topic中可以包含多个Queue，每个Queue中存放的就是该topic的消息。一个topic的Queue也被称为一个topic中消息的分区（Partition）。
一个分区只能被一个消费者消费,一个分区不能被多个消费者消费。

那么有个疑问？RocketMQ广播时分区里是怎样的呢？
集群模式时RocketMQ的一条消息只能被同一个消费者组中的一个消费者消费；
广播模式时RocketMQ的一条消息会被消费者组中的每个消费者都消费一次。

5. 分片（Sharing）

分片不同于分区，分片指的是存放相同Topic的Broker。每个分片中会创建出相应数量的分区，即每个Queue的大小都是相同。

6. 消息标识（MessageId/Key）

RocketMQ中每个消息有唯一标识MessageId，且可以携带业务标识的key，以方便对消息的查询。
生产者send()消息时会生成一个MessageId，当消息到达Broker后，Broker也会自动生成一个MessageId。

msgId：由producer端生成，生成规则为producerId + 进程PID + MessageClientIDSetter类的ClassLoader的hashcode + 当前时间 + AutomicInteger自增计数器；
offsetMsgId：由broker端生成，其生成规则为 brokerId + 物理分区的offset；
key：由用户指定的业务相关的唯一标识；

二、系统架构

1. Producer

消息生产者，负责生产消息，Produer通过MQ的负载均衡模块选择相应的Boker集群队列进行消息投递，投递的过程支持快速失败并且低延迟。

RocketMQ中的消息生产者都是以生产者组（Producer Group）的形式出现的。生产者组是同一类生产者的集合，这类Producer发送相同Topic类型的消息。一个生产组可以同时发送多个主题的消息（每个生产者投递到多个topic）。

2. Consumer

消费消息者，负责消费消息。一个消息消费者会从Broker服务器中获取到消息，并对消息进行相关业务处理。

RocketMQ中的消息消费者都是以消费者组（Consumer Group）的形式出现的。消费者组是同一类消费者的集合，这类Consumer消费的是同一Topic类型的消息。消费者使得消息消费方面，实现负载均衡（这里的负载均衡指的是一个Topic中不同的Queue平均分配给一个Consumer Group中不同的Consumer消费）和容错的目标变得非常容易。

消费者组中Consumer的数量应该小于等于订阅Topic的Queue的数量，如果超过Queue数量，则多出Consumer将不能消费消息。
一个Topic类型的消息可以被多个消费者组同时消费。

注意：
1）消费者组只能消费一个Topic的消息，不能同时消费多个Topic的消息；
2）一个消费者组中的消费者必须订阅完全相同的Topic；

3. Name Server

3.1 功能介绍

Name Server是一个Broker与Topic路由的注册中心，支持Broker的动态注册与发现。

主要包含两个功能：

Broker管理：接受Broker集群的注册信息并且保存下来作为路由信息的基本数据；提供心跳检测机制，检查Broker是否还存活；
路由信息管理：每个Name Server中保存着Broker集群的整个路由信息和用于客户端查询的队列信息。Producer通过Name Server可以获取整个Broker集群的路由信息，从而进行消息的投递和消费。

3.2 路由注册

NameServer通常也是以集群的方式部署，不过，NameServer是无状态的，即NameServer集群中的各个节点间是无差异的，各节点间相互不进行信息通讯。那各节点中的数据是如何进行数据同步的呢？在Broker节点启动时，轮询NameServer列表，与每个NameServer节点建立长连接，发起注册请求。在NameServer内部维护着⼀个Broker列表，用来动态存储Broker的信息。

注意，这是与其它像zk、Eureka、Nacos等注册中心不同的地方。这种Name Server的无状态方式，有什么优缺点：
优点：Name Server集群搭建简单，扩容简单。
缺点：对于Broker，必须明确指出所有Name Server地址。否则未指出的将不会去注册。也正因为如此，NameServer并不能随便扩容。因为，若Broker不重新配置，新增的Name Server对于Broker来说是不可见的，其不会向这个Name Server进行注册。

Broker节点为了证明自己是活着的，为了维护与Name Server间的长连接，会将最新的信息以心跳包的方式上报给Name Server，每30秒发送一次心跳。心跳包中包含 BrokerId、Broker地址(IP+Port)、Broker名称、Broker所属集群名称等等。Name Server在接收到心跳包后，会更新心跳时间戳，记录这个Broker的最新存活时间。

3.3 路由剔除

由于Broker关机、宕机或网络抖动等原因，Name Server没有收到Broker的心跳，Name Server可能会将其从Broker列表中剔除。

Name Server中有⼀个定时任务，每隔10秒就会扫描⼀次Broker表，查看每一个Broker的最新心跳时间戳距离当前时间是否超过120秒，如果超过，则会判定Broker失效，然后将其从Broker列表中剔除。

扩展：对于RocketMQ日常运维工作，例如Broker升级，需要停掉Broker的工作。OP需要怎么做？
OP需要将Broker的读写权限禁掉。一旦client(Consumer或Producer)向broker发送请求，都会收到broker的NO_PERMISSION响应，然后client会进行对其它Broker的重试。
当OP观察到这个Broker没有流量后，再关闭它，实现Broker从Name Server的移除。
OP：Operations Engineer，运维工程师
SRE：Site Reliability Engineer，现场可靠性工程师

3.4 路由发现

RocketMQ的路由发现采用的是Pull模型。当Topic路由信息出现变化时，NameServer不会主动推送给客户端，而是客户端定时拉取主题最新的路由。默认客户端每30秒会拉取一次最新的路由。

扩展：
1）Push模型：推送模型。其实时性较好，是一个“发布-订阅”模型，需要维护一个长连接。而长连接的维护是需要资源成本的。该模型适合于的场景：实时性要求较高，Client数量不多，Server数据变化较频繁
2）Pull模型：拉取模型。存在的问题是，实时性较差。
3）Long Polling模型：长轮询模型。其是对Push与Pull模型的整合，充分利用了这两种模型的优势，屏蔽了它们的劣势。

3.5 客户端Name Server选择策略

这里的客户端指的是Producer与Consumer，客户端在配置时必须要写上Name Server集群的地址，那么客户端到底连接的是哪个Name Server节点呢？客户端首先会生产一个随机数，然后再与NameServer节点数量取模，此时得到的就是所要连接的节点索引，然后就会进行连接。如果连接失败，则会采用round-robin策略，逐个尝试着去连接其它节点。

首先采用的是随机策略进行的选择，失败后采用的是轮询策略。

扩展：Zookeeper Client是如何选择Zookeeper Server的？
简单来说就是，经过两次shuffle，然后选择第一台Zookeeper Server。
详细说就是，将配置文件中的zk server地址进行第一次shuffle，然后随机选择一个。这个选择出的一般都是一个host name。然后获取到该host name对应的所有ip，再对这些ip进行第二次shuffle，从shuffle过的结果中取第一个server地址进行连接。

4. Broker

4.1 功能介绍

Broker充当着消息中转角色，负责存储消息、转发消息。Broker在RocketMQ系统中负责接收并存储从生产者发送来的消息，同时为消费者的拉取请求作准备。Broker同时也存储着消息相关的元数据，包括消费者组消费进度偏移offset、主题、队列等。

Kafka 0.8版本之后，offset是存放在Broker中的，之前版本是存放在Zookeeper中的。

4.2 模块构成

Remoting Module：整个Broker的实体，负责处理来自clients端的请求。而这个Broker实体则由以下模块构成。
Client Manager：客户端管理器。负责接收、解析客户端(Producer/Consumer)请求，管理客户端。例如，维护Consumer的Topic订阅信息。
Store Service：存储服务。提供方便简单的API接口，处理消息存储到物理硬盘和消息查询功能。
HA Service：高可用服务，提供Master Broker 和 Slave Broker之间的数据同步功能。
Index Service：索引服务。根据特定的Message key，对投递到Broker的消息进行索引服务，同时也提供根据Message Key对消息进行快速查询的功能。

4.3 集群部署

为了增强Broker性能与吞吐量，Broker一般都是以集群形式出现的。各集群节点中可能存放着相同Topic的不同Queue。不过，这里有个问题，如果某Broker节点宕机，如何保证数据不丢失呢？其解决方案是，将每个Broker集群节点进行横向扩展，即将Broker节点再建为一个HA集群，解决单点问题。