一、简介
1、常见的MQ协议
JMS:是java平台上有关MOM的技术规范,它便于消息系统中的java应用程序进行消息交换,并且通过提供标准的产生、发送、接收消息的接口,简化企业应用的开发。ActiveMQ是该协议的典型实现。
STOMP:是一种MOM设计的简单文本协议。STOMP提供一个可互操作的连接格式,允许客户端与任意STOMP消息代理进行交互。ActiveMQ是协议的典型实现,RabbitMQ通过插件可以支持该协议。
AMQP:一个提供统一消息服务的应用层标准,是应用层协议的一个开放标准,是一种MOM设计。基于此协议的客户端与消息中间件可传递消息,并不受客户端/中间件不同产品,不同开发语言等条件的限制。RabbitMQ是该协议的典型实现。
MQTT:是IBM开发的一个即使通信协议,是一种二进制协议,主要用于服务器和低功耗IoT设备间的通信。该协议支持所有平台,几乎可以把所有联网物品和外部连接起来,被用来当做传感器和制动器的通信协议。RabbitMQ通过插件可以支持协议。
2、RocketMQ简介
RocketMQ是一个统一消息引擎,轻量级数据处理平台。
3、基本概念
1、消息
消息是指,消息系统所传输信息的物理载体,生产和消费数据的最小单位,每条消息必须属于一个主体。
2、主题
topic标识一类消息的集合,每个主题包含若干个消息,每条消息只能属于一个主题,是RocketMQ进行消息订阅的基本单位。
一个生产者可以同时发送多种topic的消息;而一个消费者只对某种特定的topic感兴趣,即只可以订阅消费一种topic的消息。
3、标签
为消息设置的标签,用于同一主题下区分不同类型的消息。来自同一业务单元的消息,可以根据不同业务目的在同一主题下设置不同标签。标签能够有效地保持代码的清晰度和连贯性,并优化RocketMQ提供的查询系统。消费者可以根据tag实现对不同子主题的不同消费逻辑,实现更好的扩展性。
4、队列
存储消息的物理试题。一个topic可以包含多个Queue,每个Queue中存放的就是该topic的消息。一个topic的Queue也被称为一个Topic中消息的分区。
一一个Topic的Queue中的消息只能被一个消费者组中的一个消费者消费。
5、消息标识
RocketMQ中每一个消息拥有唯一的MessageId,且可以携带具有业务标识的key,以方便对消息的查询。不过需要注意的是,MessageId有两个,在生产者send()消息时会自动生成一个MessageId(msgId),当消息到达Broke后,Broker也会自动生成一个MessageId(offsetMsgId)。msgId、offsetMsgId与key都称为消息标识。
-
msgId:由producer端生成,其生成规则为:
producerIp + 进程pid + MessageClientIDSetter类的ClassLoader的hashCode + 当前时间 + AutomicInteger自增计数器。
-
offsetMsgId:由broke端生成,其生成规则为:brokeIp + 物理分区的offset(Queue中的偏移量)
-
key:由用户指定的业务相关的唯一标识
4、系统架构
1、producer
消息生产者,负责生产消息。Producer通过MQ的负载均衡模块选择相应的Broker集群队列进行消息投递,投递过程支持快速并且低延迟。
RocketMQ中的消息生产者都是以生产者组的形式出现的。生产者组是同一类生产者的集合,这类Producer发送相同Topic类型的消息。
2、consumer
消息消费者,负责消费消息。一个消息消费者会从Broker服务器中获取到消息,并对消息进行相关业务处理。
RocketMQ中的消息消费者都是以消费者组的形式出现的。消费者组是同一类消费者的集合,这类Consumer消费的是同一个Topic类型的消息。消费者组使得消息消费方面,实现负载均衡
(将一个topic中的不同的Queue平均分配给同一个Consumer Group的不同的Consumer)和容错的目标变得非常容易。
消费者组中的Consumer的数量应该小于等于订阅Topic的Queue数量。如果超出Queue数量,则多出的Consumer将不能消费消息。
一个topic类型的消息可以被多个消费者组同时消费。
注意:
1)消费者组只能消费一个topic的消息,不能同时消费多个topic消息
2)一个消费者组中的消费者必须订阅完全相同的Topic
3、Name Server
NameServer是一个Broker与Topic路由的注册中心,支持Broker的动态注册与发现。
主要包含两个功能:
-
Broker管理:接受Broker集群的注册信息并且保存下来作为路由信息的基本数据;提供心跳检测机制,检查Broker是否还存活。
-
路由信息管理:每个NameServer中保存着Broker集群的整个路由信息和用于客户端查询的队列信息。Producer和Consumer通过NameServer可以获取整个Broker集群的路由信息,从而进行消息的投递和消费
路由注册
NameServer通常也是以集群的方式部署,不过,NameServer是无状态的,即NameServer集群中的各个节点间是无差异的,个节点间相互不进行信息通讯。那各节点中的数据是如何进行数据同步的呢?在Broker节点启动时,轮询NameServer列表,与每个NameServer节点建立长连接,发起注册请求。在NameServer内部维护这一个Broker列表,用来动态存储Broker的信息。
Broker节点为了证明自己是活着的,为了维护与NameServer间的长连接,会将最新的信息以心跳包的方式上报给NameServer,每30秒发送一次心跳。心跳包中包含BrokerId、Broker地址、Broker名称、Broker所属集群名称等等。NameServer在接受到心跳包后,会更新心跳时间戳,记录这个Broker的最新存活时间。
路由剔除
由于Broker关机、宕机或者网络抖动等原因,NameServer没有收到Broker的心跳,NameServer可能会将其从Broker列表中剔除。
NameServer中有一个定时任务,每隔10秒就会扫描一次Broker表,查看没一个Broker的最新心跳时间戳距离当前时间是否超过120秒,如果超过,则会判定Broker失效,然后将其从Broker列表中剔除。
路由发现
RocketMQ的路由发现采用的是Pull模型。当Topic路由信息出现变化时,NameServer不会自动推送给客户端,而是客户端定时拉取主题最新的路由。默认客户端没30秒会拉取一次最新的路由。
客户端NameServer选择策略
客户端在配置时必须要写上NameServer集群的地址,那么客户端到底连接的是哪个NameServer节点,客户端首先会生成一个随机数,然后再与NameServer节点数量取模,此时得到的就是所要连接的节点索引,然后就会进行连接。如果连接失败,则会采用round-robin策略,逐个尝试着去连接其他节点。
4、Broker
功能介绍
Broker充当着消息中转角色,负责存储消息、转发消息。Broker在RocketMQ系统中负责接收并存储从生产者发送来的消息,同时为消费者的拉取请求做准备。Broker同时也存储着消息相关的元数据,包括消费者组消费进度偏移offset、主题、队列等。
Remoting Module:
整个Broker的实体,负责处理来自clients端的请求。而这个Broker实体则由一下模块构成。
Client Manager:
客户端管理器。负责接收、解析客户端(Producer/Condumer)请求,管理客户端。例如,维护Consumer的Topic订阅信息。
Store Service:
存储服务。提供方便简单的API接口,处理消息存储到物理硬盘和消息查询功能。
HA Service:
高可用服务,提供Master Broker和SalveBroker之间的数据同步功能。
5、工作流程
-
启动NameServer,NameServer启动后开始家庭端口,等待Broker、Producer、Consumer连接。
-
启动Broker时,Broker会与所有的NameServer建立并保持长连接,然后每30秒向NameServer定时发送心跳包。
-
收发消息前,可以先创建Topic,创建Topic时需要制定该Topic要存储在哪些Broker上,当然,在创建Topic时也会将Topic与Broker的关系写入到NameServer中。不过,这步是可选的,也可以在发送消息是自动创建opic.
手动创建Topic时,有两种模式:
-
集群模式:该模式下创建的Topic在该集群中,所有Broker中的Queue数量是相同的。
-
Broker模式:该模式下创建的Topic在该集群中,每个Broker中的Queue数量可以不同。
自动创建Topic时,默认采用的是Broker模式,会为每个Broker默认创建4个Queue
-
-
Producer发送消息,启动时先跟NameServer集群中的其中一台建立长连接,并从NameServer中获取路由信息,即当前发送的Topic的Queue与Broker的地址(Ip+Port)的映射关系。然后根据算法策略选择一个Queue,与队列所在的Broker建立长连接。
-
Consumer跟Producer类似,跟其中一台NameServer建立长连接,获取其所订阅Topic的路由信息,然后根据算法策略从路由信息中获取到其所要消费的Queue,然后直接跟Broker建立长连接,开始消费其中的消息。Consumer在获取到路由信息后,同样也会每30秒从NameServer更新一次路由信息。不过不同于Producer的是,Consumer还会向Broker发送心跳,以确保Broker的存活状态。
5、读写队列
读写队列从物理上来讲是同一个队列,当手动创建的topic中的队列数不一样的时候,创建数量大的个数个队列。
当读队列大于写队列的时候,后几个多出来的队列中不会有数据,当写队列大于读队列的时候,好几个队列中的消息不会被消费到。
这样设计的目的是为了方便topic中Queue的缩容。
perm:用于设置对当前创建爱你Topic的操作权限:2表示只写,4表示只读,6表示读写
二、工作原理
三、使用
1、docker安装rocketMQ
-
查看镜像所有版本
curl https://registry.hub.docker.com/v1/repositories/foxiswho/rocketmq/tags\ | tr -d '[\[\]" ]' | tr '}' '\n'\ | awk -F: -v image='foxiswho/rocketmq' '{if(NR!=NF && $3 != ""){printf("%s:%s\n",image,$3)}}'
-
拉取镜像
#服务端镜像 docker pull foxiswho/rocketmq:server-4.7.0 #broke镜像 docker pull foxiswho/rocketmq:broker-4.7.0
3、创建数据挂载目录
#创建服务端挂载目录 mkdir -p /quse/rocketmq/server/logs mkdir -p /quse/rocketmq/server/store #创建broker挂载目录 mkdir -p /quse/rocketmq/broker/logs mkdir -p /quse/rocketmq/broker/store mkdir -p /quse/rocketmq/broker/conf
4、创建broker配置文件
vim /quse/rocketmq/broker/conf/broker.conf
# nameServer地址,分号分割 namesrvAddr=42.192.36.182:9876 brokerClusterName = DefaultCluster #broker名称,master和slave使用相同的名称,表明他们的主从关系 brokerName = broker-a #0表示Master,大于0表示不同的slave brokerId = 0 #表示几点做消息删除动作,默认是凌晨4点 deleteWhen = 04 #在磁盘上保留消息的时长,单位是小时,默认是48小时 fileReservedTime = 48 #有三个值:SYNC_MASTER,ASYNC_MASTER,SLAVE;同步和异步表示Master和Slave之间同步数据的机制; brokerRole = ASYNC_MASTER #刷盘策略,取值为:ASYNC_FLUSH,SYNC_FLUSH表示同步刷盘和异步刷盘;SYNC_FLUSH消息写入磁盘后才返回成功状态,ASYNC_FLUSH不需要; flushDiskType = ASYNC_FLUSH # 设置broker节点所在服务器的ip地址 brokerIP1 = 42.192.36.182 # 是否允许 Broker 自动创建 Topic,建议线下开启,线上关闭 autoCreateTopicEnable=false # 是否允许 Broker 自动创建订阅组,建议线下开启,线上关闭 autoCreateSubscriptionGroup=false # Broker 对外服务的监听端口 listenPort=10911
5、docker-compose创建容器
version: '3.0' services: rmqnamesrv: image: foxiswho/rocketmq:server-4.7.0 container_name: rmqnamesrv ports: - 9876:9876 volumes: - ./quse/rocketmq/server/logs:/opt/logs - ./quse/rocketmq/serve/store:/opt/store rmqbroker: image: foxiswho/rocketmq:broker-4.7.0 container_name: rmqbroker ports: - 10909:10909 - 10911:10911 volumes: - ./quse/rocketmq/broker/logs:/opt/logs - ./quse/rocketmq/broker/store:/opt/store - ./dquse/rocketmq/broker/conf/broker.conf:/etc/rocketmq/broker.conf environment: NAMESRV_ADDR: "rmqnamesrv:9876" JAVA_OPTS: " -Duser.home=/opt" JAVA_OPT_EXT: "-server -Xms128m -Xmx128m -Xmn128m" command: mqbroker -c /etc/rocketmq/broker.conf depends_on: - rmqnamesrv rmqconsole: image: styletang/rocketmq-console-ng:1.0.0 container_name: rmqconsole ports: - 18080:8080 environment: JAVA_OPTS: "-Drocketmq.namesrv.addr=rmqnamesrv:9876 -Dcom.rocketmq.sendMessageWithVIPChannel=false" depends_on: - rmqnamesrv
注意事项:home目录下的文件不能挂载到属主机上,就算做了目录映射,文件因为不能写入
2、集群搭建方式
3、刷盘策略
刷盘策略指的是broker中消息的落盘方式,即消息发送到broker内存消息持久化到磁盘的方式。分为同步刷盘和异步刷盘:
-
同步刷盘:当消息持久化到broker的磁盘后才算是消息写入成功。
-
异步刷盘:当消息写入到broker的内存后即表示消息写入成功,无序等待消息持久化到磁盘。
1)异步刷盘策略会降低系统的写入延迟,RT变小,提高了系统的吞吐量。
2)消息写入到Broker的内存,一般是写入到PageCache
3)对于异步刷盘策略,消息会写入到PageCache后立即返回成功ACK.但并不会立即做落盘操作,而是当PageCache到达一定量时会自动落盘。
4、消息的生产
1、消息的生产过程
Produce可以将消息写入到某Broker的某Queue中,其经历如下过程:
-
Producer发送消息之前,会先向NameServer发出获取消息Topic的路由信息的请求。
-
NameServer返回该Topic的路由表及Broker列表.
-
Producer根据代码中指定的Queue选择策略,从Queue列表中选出一个队列,用于后续存储消息。
-
Produer对消息做一些特殊处理,例如,消息本身超过4M,则会对其进行压缩。
-
Producer向选择出的Queue所在的Broker发出RPC请求,将消息发送到选择的Queue
路由表:实际是一个Map,key为topic名称,value是一个QueueData实例列表。QueueData并不是一个Queue对应一个QueueData,而是一个Broker中该Topic的所有Queue对应一个QueueData.即,只要涉及到该Topic的Broker,一个Broker对应一个QueueData。QueueData中包含brokerName.
Broker列表:其实际也是一个Map。key为brokerName,value为BrokerData。一套brokerName名称相同的Master-Salve小集群对应一个BrokerData.BrokerData中包含brokerName及一个map。改map的key为brokerId,value为该broker对应的地址。brokerId为0标识为Master,非0表示为Salve
2、Queue选择算法
对于无序消息,其Queue选择算法,也成消息投递算法,常见的有两种: