消息队列——RabbitMQ
一、MQ的相关概念
- 什么是MQ
MQ(message queue)
,从字面意思上看,本质是个队列,FIFO先入先出
,只不过队列中存放的内容是message
而已,还是一种跨进程的通信机制
,用于上下游传递消息
。在互联网架构中,MQ
是一种非常常见的上下游“逻辑解耦 + 物理解耦”
的消息通信服务。使用了MQ
之后,消息发送上游只需要依赖MQ
,不用依赖其他服务。
上下游传递消息: 简单点说就是A与B
之间传递消息称之为上下游传递消息。 - 为什么要用MQ
- 流量消峰
举个例子,如果订单系统最多能处理一万次订单,这个处理能力应付正常时段的下单绰绰有余,正常时段我们下单一秒后就能返回结果。但是在高峰期,如果有两万次下单操作系统是处理不了的,只能限制订单超过一万后不允许用户下单。使用消息队列做缓冲,我们可以取消这个限制,把一秒内下的订单分散成一段时间来处理,这时有些用户可能在下单十几秒后才能收到下单成功的操作,但是比不能下单的体验要好。
- 应用解耦
以电商应用为例,应用中有订单系统、库存系统、物流系统、支付系统。用户创建订单后,如果耦合调用库存系统、物流系统、支付系统。任何一个子系统出了故障,都会造成下单操作异常。当转变成基于消息队列的方式后,系统间调用的问题就会减少很多,比如物流系统因为发生故障,需要几分钟来修复。在这几分钟的时间里,物流系统要处理的内存被缓存在消息队列中,用户的下单操作可以正常完成。当物流系统恢复后,继续处理订单信息即可,中单用户感受不到物流系统的故障,提升系统的可用性。
- 异步处理
有些服务调用是异步的,例如A调用B,B需要花费很长时间执行,但是A需要知道B什么时候可以执行完,以前一般有两种方式,A过一段时间去调用B的查询api查询。或者A提供一个callback api,B执行完之后调用api通知A服务。这两种方式都不是很优雅,使用消息总线,可以很方便解决这个问题,A调用B服务后,只需要监听B处理完成的消息,当B处理完成后,会发送一条消息给MQ,MQ会将此消息转发给A服务。这样A服务既不用循环调用B的查询api,也不用提供callback api。同样B服务也不用做这些操作。A服务还能及时的得到异步处理成功的消息。
- MQ的分类
-
ActiveMQ
优点: 单机吞吐量万级,时效性ms级,可用性高,基于主从架构实现高可用性,消息可靠性较低的概率丢失数据
缺点: 官方社区现在对ActiveMQ 5.x维护越来越少,高吞吐量场景较少使用。 -
kafka
大数据的杀手锏,谈到大数据领域内的消息传输,则绕不开kafka
,这款为大数据而生的消息中间件,以其百万级TPS的吞吐量名声大噪,迅速成为大数据领域的宠儿,在数据采集、传输、存储的过程中发挥着举足轻重的作用。目前已经被LinkedIn,Uber、Twitter、Netflix
等大公司所采纳。
优点:性能卓越,单机写入TPS
约在百万条/秒,最大的优点,就是吞吐量高。时效性ms级
可用性非常高,kafka是分布式的
,一个数据多个副本,少数机器宕机,不会丢失数据,不会导致不可用,消费者采用Pull方式
获取消息,消息有序,通过控制能够保证所有消息被消费且仅被消费一次;有优秀的第三方Kafka Web
管理界面Kafka-Manager
;在日志领域比较成熟,被多家公司和多个开源项目使用;功能支持:功能较为简单,主要支持简单的MQ功能
,在大数据领域的实时计算以及日志采集被大规模使用
缺点:Kafka单击超过64个队列/分区,Load会发生明显的飙高现象,对列越多,load越高
,发送消息响应时间越长,使用短轮询方式,实时性取决于轮询间隔时间,消费失败不支持重试;支持消息顺序,但是一台宕机后,就会产生消息乱序,社区更新较慢; -
RocketMQ
RocketMQ
出自阿里巴巴的开源产品,用Java语言实现,在设计时参考了Kafka
,并做出了自己的一些改进。被阿里巴巴广泛应用在订单、交易、充值、流计算,消息推送,日志流处理,binglog分发
等场景。
优点:单机吞吐量十万级,可用性非常高,分布式架构,消息可以做到0丢失,MQ
功能较为完善,还是分布式的,扩展性好,支持10亿级别的消息堆积,不会因为堆积导致性能下降,源码是java我们可以自己阅读源码,定制自己公司的MQ
。
缺点:支持的客户端语言不多,目前是java以及c++,其中c++不成熟
;社区活跃度一般,没有在MQ核心中去实现JMS等接口
,有些系统要迁移需要修改大量代码。 -
RabbitMQ
2007年发布,是一个在AMQP(高级消息队列协议)
基础上完成的,可复用的企业消息系统,是当前最主流的消息中间件之一。
优点:由于erlang语言的高并发特性,性能较好;吞吐量到万级,MQ功能比较完备,健壮、稳定、易用、跨平台、支持多种语言 如:Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOM
P等,支持AJAX文档
齐全;开源提供的管理界面非常棒
,用起来很好用,社区活跃度高;更新频率相当高https://www.rabbitmq.com/news.html
缺点:商业版需要收费,学习成本较高
- MQ的选择
- kafka
特点:大量数据、大型公司、日志采集
Kafka主要特点是基于Pull的模式来处理消息消费,追求高吞吐量,一开始的目的就是用于日志收集和传输,适合产生大量数据的互联网服务的数据收集业务。大型公司建议可以选用,如果有日志采集功能,肯定是首选kafka了。 - RocketMQ
特点:金融互联网、高并发场景
天生为金融互联网领域而生,对于可靠性要求很高的场景,尤其是电商里面的订单扣款,以及业务削峰,在大量交易涌入时,后端可能无法及时处理的情况。RockMQ
在稳定性上可能更值得信赖,这些业务常见在阿里双11
已经经历了多次考验,如果你的业务有上述并发场景,建议可以选择RocketMQ
- RabbitMQ
特点:数据量没那大、中小型公司
结合erlang
语言本身的并发优势,性能好时效性微秒级,社区活跃度也比较高,管理界面用起来身份方便,如果你的数据量没有那么大,中小型公司优先选择功能比较完备的RabbitMQ
二、RabbitMQ
- RabbitMQ的概念
概念:进行接收、存储、转发消息、但是不处理消息
RabbitMQ
是一个消息中间件:它接受并转发消息。你可以把它当做一个快递站点,当你要发送一个包裹时,你把你的包裹放到快递站,快递员最终会把你的快递送到收件人那里,按照这种逻辑RabbitMQ
是一个快递站,一个快递员帮你传递快件。RabbitMQ
与快递站的主要区别在于,它不处理快件而是接收,存储和转发消息数据。
- 四大核心概念
- 生产者
- 交换机
- 队列
- 消费者
两个消费者对应同一个队列只有一个消费者能收到消息
- Rabbit核心部分
1、Hello World
(简单模式)
2、Work queue
(工作模式)
3、publish/Subscribe
(发布订阅模式)
4、Routing
路由模式
5、Topics
主题模式
6、Publisher Confirms
发布确认模式 - 各个名词介绍
- Broker:消息实体, 接收和分发消息的应用,
RabbitMQ Server
就是Message Broker
- Virtual host:出于多租户和安全因素设计的,把AMQP的基本组件划分到一个虚拟的分组中,类似于网络中的
namespace
概念。当多个不同的用户使用同一个RabbitMQ server
提供的服务时,可以划分出多个vhost
,每个用户在自己的vhost创建exchange/queue
等。 - Connection:
publisher/consumer和broker
之间的TCP
连接 - Channel:发送消息的通道, 如果每一次访问
RabbitMQ
都建立一个Connection
,在消息量大的时候建立TCP Connection
的开销将是巨大的,效率也较低。Channel
是在connection
内部建立的逻辑连接,如果应用程序支持多线程,通常每个thread
创建单独的channel
进行通讯,AMQP method
包含了channel id
帮助客户端和message broker
识别channel
,所以channel
之间是完全隔离的。+Channel
作为轻量级的。Connection
极大减少了操作系统建立TCP connection
的开销。 - Exchange:
message
到达broker
的第一站,根据分发规则,匹配查询表中的routing key
,分发消息到queue
中去。常用的类型有:direct(point-to-point),topic(publish-subscribe)and fanout(multicast)
- Queue:消息最终被送到这里等待
consumer
取走 - Binding:
exchange和queue
之间的虚拟连接,binding
中可以包含routing key
,Binding
信息被保存到exchange
中的查询表中,用于message
的分发依据。