1.1 MQ 的相关概念
1.1.1 什么是MQ
MQ(message queue),从字面意思来看,本质是一个队列,FIFO 先入先出,只不过队列中存放的内容是 message 而已,还是一种跨进程的通信机制,用于上下游传递消息。
在互联网架构中,MQ 是一种非常常见的上下游 “逻辑解耦 + 物理解耦” 的消息通信服务。使用了 MQ 之后,消息发送上游只需要依赖 MQ ,不用依赖其他服务。
1.1.2 为什么要用 MQ (作用、功能)
1. 流量消峰
-
举例:
如果订单系统一次最多能处理一万次订单,这个处理能力应付正常时段的下单绰绰有余,正常下单一秒后返回结果。但是在高峰期,如果有两万次下单操作系统是处理不了的,只能限制订单的后一万用户不能操作。
这种情况下,可以使用消息队列做缓冲,取消这个限制,把一秒内下的订单分散到一段时间来处理,这时有些用户可能在下单十几秒后才能收到下单成功的操作,但是比不能下单的体验要好多了。
2. 应用解耦
-
举例:
以电商应用为例,应用中有订单系统、库存系统、物流系统、支付系统等。用户创建订单后,如果耦合调用库存系统、物理系统、支付系统,任何一个子系统出了问题,就会造成下单操作异常,不能正常进行下单。
当转变成基于消息队列的方式后,系统间调用的问题就会减少很多,比如物流系统因为发生故障需要几分钟修复,在这段时间,物流系统要处理的内存被缓存在消息队列中,用户的下单操作可以正常完成。当物流系统恢复后,继续处理订单欣喜即可,下单用户感受不到物流系统的故障,提升了系统的可用性。
3. 异步处理
-
举例:
有些服务间调用是异步的,例如 A 调用 B ,B 需要很长时间去执行,但是 A 需要知道 B 什么时候可以执行完。以前一般有两种方式,A 过一段时间去调用 B的查询 api 查询。或者 A 提供一个 callback api,B执行完之后调用 api 通知 A 服务。
这两种方式都不是很优雅,使用消息总线,可以很方便的解决这个问题,A 调用 B 服务后,只需要监听 B 处理完成的消息,当 B 处理完成后,会发一条消息给 MQ,MQ 会将此消息发给 A 服务。这样 A服务既不能循环调用 B 的查询 api,也不用提供 callback api。同样 B 服务也不用做这些操作,A 服务还能及时得到异步处理成功的消息。
1.1.3 MQ 的分类
ActiveMQ
- 优点:单机吞吐量万级,时效性 ms 级,可用性高,基于主从架构实现高可用性,消息可靠性高,丢失数据的概率较低
- 缺点:官方社区现在对 ActiveMQ 5.xx 后的版本 维护越来越少,高吞吐量场景较少使用
Kafka
-
大数据的杀手锏。这款为大数据而生的消息中间件,以其百万计 TPS 的吞吐量名声大噪,迅速成为大数据领域的宠儿,在数据采集、传输、存储的过程中发挥着举足轻重的作用。目前已被 LinkedIn、Uber、Twitter、Netfix等大公司采纳
-
优点:
- 性能卓越,单机写入 TPS 约在百万级每秒,最大的优点就是吞吐量高。时效性 ms 级,可用性非常高,kafka是分布式的,一个数据多个副本,少数数据宕机,不会丢失数据,不会导致不可用
- 消费者采用 pull 方式获取消息,消息有序,通过控制可以保证所有的消息被消费且仅被消费一次
- 有优秀的第三方 Kafka Web 管理界面 Kafka-Manager
- 在日志领域较为成熟,被多家公司和多个开源项目使用,
- 功能支持:主要支持简单的 MQ 功能,在大数据领域的实时计算以及日志采集被大规模使用
-
缺点:
- Kafka 单机超过64个队列/分区,Load会发生明显的飙高现象(cpu飙高),队列越多,load越高,发送消息响应时间变长
- 使用短轮询方式,实时性取决于轮询间隔时间,消费失败不支持重试
- 支持消息顺序,但是一台代理宕机后,就会产生消息乱序
- 社区更新较慢
RocketMQ
-
RocketMQ 是出自阿里巴巴的开源产品,用Java语言实现,在设计时参考了Kafka,并做出了改进。被阿里巴巴广泛应用在订单、交易、充值、流计算、消息推送、日志流式处理、binglog分发 等场景
-
优点:
- 单机吞吐量十万级,可用性非常高,消息可以做到0丢失
- 分布式架构,MQ 功能较为完善,扩展性好
- 支持十亿级别的消息堆积,不会因为堆积导致性能下降
- 源码为Java,可以阅读源码,定制自己公司的MQ
-
缺点:
- 支持的客户端语言不多,目前是Java及c++,其中c++不成熟
- 社区活跃度一般,没有在MQ核心中实现 JMS 等接口,有些系统要迁移需要修改大量代码
RabbitMQ
-
2007年发布,是一个在 AMQP(高级消息队列协议)基础上完成的,可复用的企业消息系统,是当前最主流的消息中间件之一
-
优点:
- 由于 erlang 语言的高并发性,性能较好
- 吞吐量万级
- 功能较为完备、健壮、稳定、易用、跨平台
- 支持多种语言,如python、Ruby、NET、Java、Jms、C、php、ActionScript、XMPP、STOMP等,支持ajax文档
- 开源提供的管理界面很棒
- 社区活跃度高,更新频率相当高
-
缺点:商业版需要收费,学习成本较高
1.1.4 MQ 的选择
Kafka
Kafka追求高吞吐量,目的是日志采集和传输,适用于产生大量数据的互联网服务的数据收集业务。大型公司建议可以选用,如果有日志采集功能,就肯定是首选
RocketMQ
天生为金融互联网领域而生,对于可靠性要求很高的场景,尤其是电商里面的订单扣款,以及业务削峰,大量用户涌入时。
RocketMQ 在稳定性上更值得信赖,这些业务场景在阿里双11已经经历了多次考验,如果你的业务有上述并发场景,建议选择
RabbitMQ
结合 erlang 语言本身的并发优势,性能好,时效性微秒级,社区活跃度也比较高,管理界面使用非常方便,如果数据量没有那么大,或中小型公司优先选择功能比较完备的RabbitMQ