疑问:RabbitMQ的模型架构是什么?
AMQP协议又是什么?这两者之间又有何种紧密的关系?消息从生产者发出到消费者消费这一过程要经历一些什么?
RabbitMQ的整体模型架构图:
生产者和消费者
一、Producer:生产者,就是投递消息的一方。
生产者创建消息,然后发布到RabbitMQ中。消息一般可以包含2个部分:消息提和标签(Label)。消息体也可以称之为payload,在实际应用中,消息体一般是一个带有业务逻辑结构的数据,比如:一个JSON字符串。当然可以进一步对这个消息体进行序列化操作。消息的标签用来表述这条消息,比如一个交换器的名称和一个路由键。生产者把消息交由RabbitMQ,RabbitMQ之后会根据标签把消息发送给感兴趣的消费者(Consumer)。
Consumer :消费者,就是接收消息的一方。
消费者连接到
RabbitMQ
服务器,并订阅到队列上。当消费者消费一
条消息时,只是消费
消息的消息体(
payload
)。在消息路由的过程中,消息的标签会丢弃,存入到队列中的消息只
有消息体,消费者也只会消费到消息体,也就不知道消息的生产者是谁,当然消费者也不需要
知道。
Broker :消息中间件的服务节点
对于
RabbitMQ
来说,
RabbitMQ
Broker
可以简单地看作
一个
RabbitMQ
服务节点,
或者
RabbitMQ
服务实例。大多数情况下也可以将
RabbitMQ
Broker
看作
RabbitMQ
服务器。
以下是:生产者将消息存入RabbitMQ Broker,以及消费者从Broker中消费数据的整个流程。
二、队列
Queue:队列,是RabbitMQ的内部对象,用于存储消息。
RabbitMQ
中消息都只能存储在队列中,这一
点和
Kafka
这种消息中间件相反。
Kafka
将消
息存储在
top
ic
(主题)这个逻辑层面,而相对应的队列逻辑只是
topic
实际存储文件中的位移
标识。
Rabbi
tMQ
的生产者生产消息井最终投递到队列中,消费者可以从队列中获取消息并消费。
多个消费者可以订阅同一个队列,这时队列中的消息会被平均分摊(Round-Robin,即轮询)给多个消费者进行处理,而不是每个消费者都收到所有的消息并处理。
RabbitMQ不支持队列层面的广播消费,如果需要广播消费,需要在其上进行二次开发,处理逻辑会变得异常负责,同时也不建议这么做。
三、交换器、路由键、绑定
Exchange:交换器,
生产者将消息发送到
Exchange
(交换器,通常也
可以用大写的“X
”来表示),由交换器将消息路由到一个或者多个队列中。如果路由不到,或
许会返回给生产者,或许直接丢弃。
RabbitMQ中的交换器有四种类型,不同的类型有着不同的路由策略。
RoutingKey
:路由键
。生产者将消息发给交换器
的时候,
一般会
指定
一个
RoutingKey
,用
来指定这个消息的路由规则,而这个
Routing
Key
需要与交换器类型和绑定键(
BindingKey
)联
合使用才能最终生效。
在交换器类型和绑定键(
BindingKey
)固定的情况下,生产者可以在发送消息给交换器时,
通过指定
RoutingKey
来决定消息流向哪里。
Binding
:绑定
RabbitMQ
中通过绑定将交换器与队列关联起来,在绑定的时候
一般会指
定一个
绑定键(
BindingKey
,这样
RabbitMQ
就知如
何正
确地
将消息路由到
队列了,
2-6
所示。
生产者将消息发送给交换器时,需要一个RoutingKey,当BindingKey和RoutingKey相匹配,消息会被路由到对应的队列中。在绑定多个队列到同一个交换器的时候,这些绑定允许使用相同的BIndingKey。BindingKey并不是在所有的情况下都生效,它依赖于交换器类型,比如:fanout类型的交换器就会无视BindingKey,而是将消息路由到所有绑定到该交换器的队列中。
形象地比喻:交换器相当于投递包裹的邮箱,RoutingKey相当于填写在包裹上的地址,Bindingkey就相当于包裹的目的地,当填写在包裹上的地址和实际想要投递的地址相匹配时,那么这个包裹就会被正确投递到目的地,最后这个目的地的“主人”--队列可以保留这个包裹。如果填写的地址出错,邮递员不能正确投递到目的地,包裹可能会回退给寄件人,也可能被丢弃。
四、交换器类型:
RabbitMQ
常用的交换器类型有
fanout direct topic
headers
这四种
AMQP
协议
里还提
到另外两种类型:
System
和自定义,这里不予描述。对于这四种类型下面一一阐述。
fanout
它会把所有发送到该交换器的消息路由到所有与该交换器绑定的队列中。
direct
direct 类型的交换器路由规则也很简单,它会把消息路由到那些
BindingKey
RoutingKey
完全匹配的队列中。
topic
前面讲到
direct
类型的交换器路由规则是完全匹配
BindingKey RoutingKey
,但是这种严
格的匹配方式在很多情况下不能满足实际业务的需求。
topic
类型的交换器在匹配规则上进行了
扩展,它与
direct
类型的交换器相似,也是将消息路由到
BindingKey RoutingKey
相匹配的队
列中,但这里的匹配规则有些不同,它约定:
RoutingKey
为一个点号“
”分隔的字符串(被点号“.”分隔开的每
段独立的字符
串称为一个单词),如“
com.rabbi
q.client
',、"
java.
util.concurrent
”、“
com.hidden
.c
lient“;
Bin
dingKe
Routin
gKey
一样也是点号“.”分隔的字符串;
BindingKey 中可以存在两种特殊字符串“*”和“#”,用于做模糊匹配,其中“#”用
于匹配
个单词,吁”用于匹配多规格单词(可以是零个)。
headers
headers
类型的交换器不依赖于路由键的匹配规则来路由消息,而是根据发送的消息内容中
headers
属性进行匹配。在绑定队列和交换器时制定一组键值对,当发送消息到交换器时,
RabbitMQ
会获取到该消息的
headers
(也是一个键值对的形式〉
,对比
其中的键值对是否完全
匹配队列和交换器绑定时指定的键值对,如果完全匹配则消息会路由到该队列,否则不会路由
到该队列
headers
类型的交换器性能会很差,而且也不实用,基本上不会看到它的存在。
五、RabbitMQ运转流程:
生产者发送消息的时候:
(1)生产者连接到 RabbitMQ Broker 建立一个连接( onnection ),开启一个信道(channel)
(2)生产者声明一个交换器,并设置相关属性,比如交换机类型、是否持久化等
(3)生产者声明一个队列并设置相关属性,比如是否排他、是否持久化、是否自动删除等
(4)生产者通过路由键将交换器和队列绑定起来
(5)生产者发送消息至RabbitMQ Broker,其中包含路由键、交换器等信息
(6)相应的交换器根据接收到的路由键查找相匹配的队列
(7)如果找到,则将从生产者发送过来的消息存入相应的队列中。
(8)如果没有找到 ,则根据生产者配置的属性选择丢弃还是回退给生产者
(9)关闭信道。
(10)关闭连接。
消费者接收消息的过程:
(1)消费者连接到 RabbitMQ Broker ,建立一个连接( Connection ),开启一个信道( Channel)
(2)消费者向 RabbitMQ Broker 请求消费相应队列中的消息,可能会设置相应的回调函数,以及做 些准备工作
(3)等待 RabbitMQ Broker 回应并投递相应队列中的消息,消费者接收消息。
(4)消费者确认( ack )接收到的消息
(5)RabbitMQ 从队列中删除相应己经被确认的消息
(6)关闭信道。
(7)关闭连接。
引入两个新概念:
Connection和Channel
。我们知道无论是生产者还是消费者,都需要和 RabbitMQ
Broker
建立连接,这个连接就是一条
TCP
连接,也就是Connection
TCP
连接建立起来,客户端紧接着可以创建一个
AM
QP
信道(
Channel)
,每
个信道都会被指派
个唯
。信道是建立在
Connection
之上的虚拟连接,
RabbitMQ
处理
的每条
AMQP
指令都是通过信道完成的。
我们完全可以直接使用
Connection
就能完成信道的工作,为什么还要引入信道呢?试想这
样一个场景,一
个应用程序中有很多个线程需要从
RabbitMQ
中消费消息,或者生产消息,那
么必然需要建立很多个
Connection
,也就是许多个
TC
连接
。然而对于操作系统而言,建立和
销毁
TCP
连接是非常昂贵的开销,如果遇到使用高峰,性能瓶颈也随之显现。
Ra
bbitMQ
采用
类似
NI01
(Non
-blocking I/O
)的做法,选择
TCP 连接复用,不仅可以减少性能开销,同时也
便于管理
NIO
,也称非阻
I/O
,包含三
大核心部分:
Channel
(信道)、
Buffer
(缓冲区)和
Selector
(选择器)。
NIO
基于
Channel和
Buffer 进行操作,数据总是从信道读取数据到缓冲区中,或者从缓冲区写入到信道中。
Selector
用于监听多个信道的事件(比
如连接打开,数据到达等)
因此,单线程可以监听多个数据的信道。
NIO
中有
个很有名的
Reactor
模式,有兴趣的读者可以 深入研究
每个线程把持一个信道,所以信道复用了
Connection
TCP
连接。同时
RabbitMQ
可以确
保每个线程的私密性,就像拥有独立的连接一样。当每个信道的流量不是很大时,复用单
Connection
可以在产生性能瓶颈的情况下有效地节
TC
连接
资源。但是当信道本身的流量很
大时,这时候多个信道复用一个
Connection
就会产生性能瓶颈,进而使整体的流量被限制了。
此时就需要开辟多个
Connection
,将这些信道均摊到这些
Connection
中,至于这些相关的调优
策略需要根据业务自身的实际情况进行调节,更多内容可以参考第 9
章。
信道在
AMQP
是一个很重要的概念,大多数操作都是在信道这个层面展开的。在代码清单
1-1
中也可以
看出一些端倪,比如
channel
exchangeDeclare
channel.queueDeclare
channel
basicPublish
channel
basicConsume
等方法。
RabbitMQ
相关的
API
AMQP
紧密相连,比如
channel.basicPublish
对应
AMQP
Basic.Publish
命令,在下面的小
节中将会为大家一一展开。