什么是MQ
MQ为消息中间件,也称消息总线(Message Queue),是一种跨进程、异步通信的机制,用于上下文传递信息。由消息系统来确保信息的可靠性
MQ是用来干什么的
应用解耦、异步、流量削峰、数据分发、错峰控制、日志收集等等…
MQ的衡量标准
服务性能、数据存储、集群架构
主流的消息中间件
比如RabbitMQ、Kafka、ActiveMQ、ZeroMQ和阿里巴巴的Apache的RocketMQ,甚至连Redis中都存在者MQ
ActiveMQ
ActiveMQ是Apache出品的,是一个完全支持JMS(Java消息服务)规范的消息中间件,中小型企业应用广泛
缺点:性能较差,在高并发的情况下,容易出现消息阻塞、堆积、延迟等问题。
Kafka
Kafka是LinkedIn开源的分布式发布-订阅消息系统,目前属于Apache的顶级项目Kafka主要特点就是基于Pull的模式来处理消息消费,追求高吞吐量
,一开始的目的就是用于日志收集和传输。0.8版本开始支持复制,不支持事务,对消息的重复、丢失、错误没有严格要求
,适合产生大量数据的互联网服务的数据收集业务。能够支持廉价的服务器上以每秒100k条数据的吞吐量。(有ack机制,可以保证不丢失,不能保证不重复。)
高效的读写基于操作系统低层的Page Cache。仅仅使用内存管理,不存在内存和磁盘之间的IO操作。
RocketMQ
RocketMQ是阿里开源的消息中间件,目前也已经孵化为Apache顶级项目,它是纯Java开发,具有高吞吐量、高可靠性、适合大规模分布式系统应用的特点。RocketMQ思路起源于Kafka,它对消息的可靠传输以及事务性做了优化,目前在阿里集团被广泛应用于交易、充值、流计算、消息推送、日志流式处理、binlog分发等场景。
在2.0版本,RocketMQ集群也是通过Zookeeper进行管理。在3.0之后,放弃Zookeeper,使用NameServer进行集群的管理和协调。
能够保障消息的顺序消费,提供了丰富的消息拉取等处理模式,消费者可以高效进行水平扩展,能够承载上亿级别数据量级。
RabbitMQ
RabbitMQ是一个开源的消息代理和队列服务器,用来通过普通协议在不同的应用之间共享数据(跨平台跨语言)。RabbitMQ是使用Erlang
语言编写,并且基于AMQP协议实现。
Erlang语言
Erlang语言
最初用于交换机领域的架构模式,这样使得RabbitMQ在Broker之间进行数据交互的性能非常优秀(Erlang有着和原生Socket一样的延迟)。
RabbitMQ的优势:
可靠性(Reliablity):
使用了一些机制来保证可靠性,比如持久化、传输确认、发布确认。灵活的路由(Flexible Routing):
在消息进入队列之前,通过Exchange来路由消息。对于典型的路由功能,Rabbit已经提供了一些内置的Exchange来实现。针对更复杂的路由功能,可以将多个Exchange绑定在一起,也通过插件机制实现自己的Exchange。消息集群(Clustering):
多个RabbitMQ服务器可以组成一个集群,形成一个逻辑Broker。高可用(Highly Avaliable Queues):
队列可以在集群中的机器上进行镜像,使得在部分节点出问题的情况下队列仍然可用。多种协议(Multi-protocol):
支持多种消息队列协议,如STOMP、MQTT等。多种语言客户端(Many Clients):
几乎支持所有常用语言,比如Java、.NET、Ruby等。管理界面(Management UI):
提供了易用的用户界面,使得用户可以监控和管理消息Broker的许多方面。跟踪机制(Tracing):
如果消息异常,RabbitMQ提供了消息的跟踪机制,使用者可以找出发生了什么。
RabbitMQ的整体架构:
个人理解:
- Applications Produce:表示为生产者,生产者将进行进行发送,这个消息会先抵达消息队列服务器中的Exchange
- Exchange: Produce发送过消息之后进入了,交换器(Exchange)通过路由Key进行携带到消息队列当中(进入那个队列主要取决于routing-key路由键)
- Queues:消息队列中,转发消息将消息转发到,Consume(消费者)中
核心概念:
Message:消息,由请求头和请求体组成,消息是不透明的,而请求头则由一系列的可选属性组成,这些属性包括routing-key(路由键)priority(相对于其它消息的优先权)deliver-mode(指出该消息可能需要持久存储)等
Publisher:
消费的生产者,也是一个交换器发布消息的客户端应用程序
Exchange:
交换器,用来接收生产者发送的消息并将这些消息路由给服务器中的列表Exchange有四种类型:direct(默认),fanout,topic,和headers不同的类型Exchange转发消息的策略有所不同
Queue:
消息队列,用来保存消息直到发送给消费者,它是消息的容器也是消息的终点,一个消息可以投入一个或多个队列,消息一直在队列里面,等待消费者连接到这个队列将中将其取走
Binding:
绑定,用于消息队列和交换机之间的关联,一个绑定就是基于路由键将交换器和消息队列连接起来的路由规则,所以可以将交换器理解成一个由绑定构成的路由表
Exchange和Queue的绑定可以是多对多的关系
Connection:
网络连接,比如一个TCP连接
Channel:
信道,多路复用连接中的一个独立的双向数据流量通道。信道是建立在真实的TCP连接内的虚拟连接,AMQP命令都是通过信道发出去的,不管是发布消息、订阅队列、还是接收消息,这些动作都是通过信道能完成的,因为对于操作系统来说建立和销毁TCP都是非常昂贵的资源,所以引入了信道的概念,以复用一条TCP连接
Consumer:
消息的消费者,表示一个从消息队列中取得消息的客户端应用程序
Virtual Host:虚拟主机。标识一批交换机、消息队列和相关对象。虚拟主机是共享相同的身份认证和加密环境的独立服务器域。每个vhost本质上就是一个mini版的RabbitMQ服务器,拥有自己的队列、交换器、绑定和权限机制。vhost是AMQP概念的基础,必须在链接时指定,RabbitMQ默认的vhost是 /。
Broker:
表示消息队列服务器实体
上述图片执行流程:
- Publisher:消息的发布者,将消息发给,消息代理(服务器)
- 发送给服务器中的一个VHost虚拟主机,虚拟机中有非常多的自己的交换器和队列,虚拟主机将消息交给交换器
- 交换器再根据消息的路由键,来判断到底要把这个消息路由到那个消息队列里面,路由规则就是通过了Binding绑定关系来表示
- 当消息到达消息队列的时候,消费者就可以从消息队列中取出消息了
- Consumer:跟消息队列建立起连接,为了节省资源,所以每一条TCP连接里面开辟很多的管道,在这个管道里面进行数据的交互,从消息队列中拿到数据,由此从消息队列中拿到的数据就会返回给消费者
- 完成~
RabbitMQ的运行机制
AMQP中的消息路由
- AMQP中消息的路由过程和JMS存在一些差别,AMQP增加了Exchange和Binding的角色,生产者把消息发布到了Exchange上,消息最终到达了队列并被消费者接收,而Binding决定了交换器的消息该发送到那个队列
Exchange类型
- Exchange分发消息的时候,根据类型的不同分发的策略也是不一样的,目前共有四种:direct、fanout、topic、headers。header匹配AMQP消息的header而不是路由键,headers交换器和direct交换器完全一致,但性能差很多目前基本不使用了
消息路由中的路由键(routing key)如果和Binding中的binding key一致交换器就会将消息发送到对应的队列中,路由键与对列名完全匹配,例如 dog 就只转发 routing key为dog的进行匹配,它是完全匹配、单播的模式
- Fanout广播式,每个发到fanout类型交换器的消息都会分到所有绑定的队列上去。fanout交换器不处理该路由键,只是简单的将队列绑定到交换器上,每个发送到交换器的消息都会被转发到与该交换器绑定的所有队列上。很像子网广播,每台子网内的主机都获得了一份复制的消息。fanout类型转发消息是最快的,
- Topic: topic交换器通过模式匹配分配消息的路由键属性,将路由键和某个模式进行匹配,此时队列需要绑定到一个模式上。它将路由键(routing-key)和绑定键(bingding-key)的字符串切分成单词,这些单词之间用点隔开。它同样也会识别两个通配符:"#“和”*"。#匹配0个或多个单词,匹配不多不少一个单词。