《Java工程师面试突击第一季》学习笔记-消息队列06、07、08

George_Z3

已于 2022-03-16 20:53:30 修改

阅读量195

点赞数

分类专栏： Java开发之路文章标签： java 面试 rabbitmq

于 2022-01-06 20:59:05 首次发布

本文链接：https://blog.csdn.net/csdn15556927540/article/details/122352747

版权

Java开发之路专栏收录该内容

6 篇文章 1 订阅

订阅专栏

《Java工程师面试突击第一季》学习笔记-消息队列06、07、08
微信公众号，关注：georgezheng
仅做个人学习记录，内容源自石衫码农公众号教学

学习目的：

（1）帮助快速梳理互联网公司的高频Java进阶面试知识点；

（2）帮助快速夯实Java进阶技术栈的知识体系；

（3）学完出去面试，能够hold住一些互联网公司对某个技术点的连环炮问题；

目录：

06 引入消息队列之后如何保证其高可用性？

如何保证消息队列的高可用啊？

07 我的天！我为什么在消息队列里消费到了重复的数据？

如何保证消息不被重复消费（如何保证消息消费时的幂等性）？

08 啥？我发到消息队列里面的数据怎么不见了？

如何保证消息的可靠性传输（如何处理消息丢失的问题）？

-----------------------------------------------------------------正文--------------------------------------------------------------------------------

06 引入消息队列之后如何保证其高可用性？

1.面试题

如何保证消息队列的高可用啊？

（1）rabbitMQ的高可用性

RabbitMQ是比较有代表性的，因为是基于主从做高可用性的，我们就以他为例子讲解第一种MQ的高可用性怎么实现。

rabbitmq有三种模式：

	  单机模式，普通集群模式，镜像集群模式

1）单机模式

就是demo级别的，一般就是你本地启动了玩玩儿的，没人生产用单机模式

2）普通集群模式
意思就是在多台机器上启动多个rabbitmq实例，每个机器启动一个。但是你创建的queue，只会放在一个rabbtimq实例上，但是每个实例都同步queue的元数据。完了你消费的时候，实际上如果连接到了另外一个实例，那么那个实例会从queue所在实例上拉取数据过来。

在这里插入图片描述

	这种方式确实很麻烦，也不怎么好，没做到所谓的分布式，就是个普通集群。
因为这导致你要么消费者每次随机连接一个实例然后拉取数据，要么固定连接那个queue所在实例消费数据，前者有数据拉取的开销，后者导致单实例性能瓶颈。
	而且如果那个放queue的实例宕机了，会导致接下来其他实例就无法从那个实例拉取，如果你开启了消息持久化，让rabbitmq落地存储消息的话，消息不一定会丢，得等这个实例恢复了，然后才可以继续从这个queue拉取数据。
	所以这个事儿就比较尴尬了，这就没有什么所谓的高可用性可言了，这方案主要是提高吞吐量的，就是说让集群中多个节点来服务某个queue的读写操作。

3）镜像集群模式
这种模式，才是所谓的rabbitmq的高可用模式，跟普通集群模式不一样的是，你创建的queue，无论元数据还是queue里的消息都会存在于多个实例上，然后每次你写消息到queue的时候，都会自动把消息到多个实例的queue里进行消息同步。

  这样的话，好处在于，你任何一个机器宕机了，没事儿，别的机器都可以用。坏处在于，第一，这个性能开销也太大了吧，消息同步所有机器，导致网络带宽压力和消耗很重！
  第二，这么玩儿，就没有扩展性可言了，如果某个queue负载很重，你加机器，新增的机器也包含了这个queue的所有数据，并没有办法线性扩展你的queue

  那么怎么开启这个镜像集群模式呢？
  我这里简单说一下，避免面试人家问你你不知道，其实很简单rabbitmq有很好的管理控制台，就是在后台新增一个策略，这个策略是镜像集群模式的策略，指定的时候可以要求数据同步到所有节点的，也可以要求就同步到指定数量的节点，然后你再次创建queue的时候，应用这个策略，就会自动将数据同步到其他的节点上去了。

在这里插入图片描述

（2）kafka的高可用

在这里插入图片描述

kafka一个最基本的架构认识：多个broker组成，每个broker是一个节点；你创建一个topic，这个topic可以划分为多个partition，每个partition可以存在于不同的broker上，每个partition就放一部分数据。

这就是天然的分布式消息队列，就是说一个topic的数据，是分散放在多个机器上的，每个机器就放一部分数据。

实际上rabbitmq之类的，并不是分布式消息队列，他就是传统的消息队列，只不过提供了一些集群、HA的机制而已，因为无论怎么玩儿，rabbitmq一个queue的数据都是放在一个节点里的，镜像集群下，也是每个节点都放这个queue的完整数据。

	kafka 0.8以前，是没有HA机制的，就是任何一个broker宕机了，那个broker上的partition就废了，没法写也没法读，没有什么高可用性可言。
	kafka 0.8以后，提供了HA机制，就是replica副本机制。每个partition的数据都会同步到其他机器上，形成自己的多个replica副本。然后所有replica会选举一个leader出来，那么生产和消费都跟这个leader打交道，然后其他replica就是follower。写的时候，leader会负责把数据同步到所有follower上去，读的时候就直接读leader上数据即可。只能读写leader？很简单，要是你可以随意读写每个follower，那么就要care数据一致性的问题，系统复杂度太高，很容易出问题。kafka会均匀的将一个partition的所有replica分布在不同的机器上，这样才可以提高容错性。

这么搞，就有所谓的高可用性了，因为如果某个broker宕机了，没事儿，那个broker上面的partition在其他机器上都有副本的，如果这上面有某个partition的leader，那么此时会重新选举一个新的leader出来，大家继续读写那个新的leader即可。这就有所谓的高可用性了。

	写数据的时候，生产者就写leader，然后leader将数据落地写本地磁盘，接着其他follower自己主动从leader来pull数据。一旦所有follower同步好数据了，就会发送ack给leader，leader收到所有follower的ack之后，就会返回写成功的消息给生产者。（当然，这只是其中一种模式，还可以适当调整这个行为）

	消费的时候，只会从leader去读，但是只有一个消息已经被所有follower都同步成功返回ack的时候，这个消息才会被消费者读到。

07 我的天！我为什么在消息队列里消费到了重复的数据？

1.面试题

如何保证消息不被重复消费（如何保证消息消费时的幂等性）？

2.面试官心理分析

其实这是一个常见的问题，这两个问题可以连起来问。既然是消费消息，那肯定要考虑会不会重复消费？能不能避免重复消费？或者重复消费了也别造成系统异常可以吗？这个是MQ领域的基本问题，其实本质上还是在问你使用消息队列如何保证幂等性，这个是你架构中要考虑的问题。

3.面试题剖析

先大概说一说可能会有哪些重复消费的问题。

讲一个kafka的例子。

其实重复消费不可怕，可怕的是你没考虑到重复消费之后，怎么保证幂等性。

举例：假设你有一个系统，消费一条往数据库插入一条，要是你一个消息重复两次，你不就插入了两条，数据不就错了？但是你要是消费到第二条的时候，自己判断一下已经消费过了，直接扔了，不就保留了一条数据？

	幂等性：一条数据，或者一个请求，给你重复来多次，你得确保对应的数据是不对改变的，不能出错。

那么第二个问题就来了，怎么保证消息队列消费的幂等性？

其实还是要结合业务来思考，我这里给几个思路：

（1）数据写库，先按主键查，存在做update；

（2）比如你是写redis，那没问题，反正每次set，天然幂等性；

（3）如果不是上面两个场景，那做的稍微复杂一点，你需要让生产者发送每条数据的时候，里面加全局唯一ID，类似订单ID之类的东西，然后到消费者之后，先根据这个ID去比如redis查一下，之前消费过吗？如果没消费过，你就处理，然后这个id写redis。如果消费过了你就别处理，保证别重复处理相同的信息即可。

链接补充学习：一线互联网企业，高并发场景的订单号、ID生成策略

（链接：https://pan.baidu.com/s/1wGeHga802i1Emur76Y4qEg
提取码：lx1x）

还有比如基于数据库的唯一键来保证重复数据不会重复插入多条，我们之前线上系统就有这个问题，就是拿到数据的时候，每次重启可能会有重复，因为kafka消费者还没来得及提交offset，重复数据拿到了以后我们插入的时候，因为有唯一键约束了，所以重复数据只会插入报错，不会导致数据库中出现脏数据

如何保证MQ的消息是幂等性的，需要结合具体的业务来看。

08 啥？我发到消息队列里面的数据怎么不见了？

1.面试题

如何保证消息的可靠性传输（如何处理消息丢失的问题）？

2.面试官心理分析

这个是肯定的，用MQ有个基本原则，就是数据不能多一条，也不能少一条，不能多，就是刚才说的重复消费和幂等性问题。不能少就是说数据不能丢。

这个问题必须考虑。

3.面试题剖析

这个丢数据，MQ一般分为两种，要么MQ自己弄丢了，要么是我们消费的时候弄丢了。

我们从rabbitmq和kafka分别来分析一下。

rabbitmq是承载业务核心消息的，是绝对不能丢数据的。

（1）rabbitmq

1）生产者弄丢了数据

生产者将数据发送到rabbitmq的时候，可能数据半路丢了，因为网络啥的问题，都有可能。

	此时可以选择用rabbitmq提供的【事务功能】，就是生产者发送数据之前开启事务（channel.txSelect），然后发消息，如果消息没有成功被rabbitmq接收到，那么生产者会收到异常报错，此时可以回滚事务（channel.txRollback）,然后重试发送消息；如果收到了消息，那么可以提交事务（channnel.txCommit）。但是问题来了，rabbitmq事务机制一搞，基本上吞吐量会下来，因为太耗性能。

	所以一般来说，如果你要确保说写rabbitmq的消息别丢，可以【开启confim模式】，在生产者那里设置开启confim模式之后，你每次写的消息都会分配一个唯一的id，然后如果写入了rabbitmq中，rabbitmq会回传一个ack消息，告诉你说这个消息ok了。

如果rabbitmq没能处理这个消息，会回调你一个nack接口，告诉你这个消息接收失败，你可以重试。而且你可以结合这个机制自己在内存里维护每个消息id的状态，如果超过一定时间还没接收到这个消息的回调，那么你可以重发。

事务机制和cnofirm机制最大的不同在于，事务机制是同步的，你提交一个事务之后会阻塞在那儿，但是confirm机制是异步的，你发送个消息之后就可以发送下一个消息，然后那个消息rabbitmq接收了之后会异步回调你一个接口通知你这个消息接收到了。

所以一般在生产者这块避免数据丢失，都是用confirm机制的。

（2） rabbitmq弄丢了数据

就是rabitmq自己弄丢了数据，这个你必须开启rabbitmq的持久化，就是消息写入之后会持久化磁盘，哪怕mq自己挂了，恢复之后会自动读取之前存储的数据，一般数据不会丢。除非极其罕见的rabbitmq还没持久化自己就挂了，可能导致少量数据会丢失，但是这个概率很小。

	设置持久化有两个步骤，第一个是创建queue的时候将其设置为持久化，这样就可以保证rabbitmq持久化queue的数据，但是不会持久化queue里的数据；第二个是发送消息的时候将消息的deliverymodel设置为2，就是将消息设置为持久化的，此时rabbitmq就会将消息持久化到磁盘上去，必须要同时设置这两个持久化才行。

	而且持久化可以和生产者那边的confirm机制配合起来。只有消息被持久化到磁盘之后才会通知生产者ack了。所以哪怕是在持久化到磁盘之前，rabbitmq挂了，数据丢了，生产者收不到ack，你也是可以自己重发的。

哪怕是你给rabbitmq开启了持久化机制，也有一种可能，就是这个消息写到了rabbitmq中，但是还没来得及持久化到磁盘上，结果不巧，此时rabbitmq挂了，就会导致内存里的一点点数据会丢失。

（3）消费者弄丢了数据

你打开了消费者的autoAck的机制，你消费到了数据之后，消费者会自动通知rabbitmq，说ok我已经消费完这条消息了；

如果你消费到的这条消息还在处理中，还没处理完此时消费者就自动autoAckl了，通知rabbitmq这条消息已经消费；此时不巧消费者系统宕机，就会使那条消息丢失，还没处理完而且rabbitmq还以为这条消息已经处理了。

考虑优化方案：

这个时候得用rabbitmq提供的ack机制，简单来说，就是你关闭rabbitmq自动ack，可以通过一个api来调用就行，然后每次你自己代码里确保处理完的时候，再程序里ack一把。这样的话，如果你还没处理完，不就没有ack？那rabbitmq就认为你还没处理完，这个时候rabbitmq会把这个消费分配给别的consumer去处理，消息是不会丢的。

（2）kafka

1）消费端弄丢了数据

唯一可能导致消费者弄丢数据的情况，就是说，你那个消费到了这个消息，然后消费者那边自动提交了offset，让kafka以为你已经消费好了这个消息，其实你刚准备处理这个消息，你还没处理，你自己就挂了，此时这条消息就丢咯。

这不是一样么，大家都知道kafka会自动提交offset，那么只要关闭自动提交offset，在处理完之后自己手动提交offset，就可以保证数据不会丢。但是此时确实还是会重复消费，比如你刚处理完，还没提交offset，结果自己挂了，此时肯定会重复消费一次，自己保证幂等性就好了。

生产环境碰到的一个问题，就是说我们的kafka消费者消费到了数据之后是写到一个内存的queue里先缓冲一下，结果有的时候，你刚把消息写入内存queue，然后消费者会自动提交offset。

然后此时我们重启了系统，就会导致内存queue里还没来得及处理的数据就丢失了

2）kafka弄丢了数据

	这块比较常见的一个场景，就是kafka某个broker宕机，然后重新选举partiton的leader时。大家想想，要是此时其他的follower刚好还有些数据没有同步，结果此时leader挂了，然后选举某个follower成leader之后，他不就少了一些数据？这就丢了一些数据啊。

生产环境也遇到过，我们也是，之前kafka的leader机器宕机了，将follower切换为leader之后，就会发现说这个数据就丢了

所以此时一般是要求起码设置如下4个参数：

	给这个topic设置replication.factor参数：这个值必须大于1，要求每个partition必须有至少2个副本。

	在kafka服务端设置min.insync.replicas参数：这个值必须大于1，这个是要求一个leader至少感知到有至少一个follower还跟自己保持联系，没掉队，这样才能确保leader挂了还有一个follower吧

	在producer端设置acks=all：这个是要求每条数据，必须是写入所有replica之后，才能认为是写成功了

	在producer端设置retries=MAX（很大很大很大的一个值，无限次重试的意思）：这个是要求一旦写入失败，就无限重试，卡在这里了

我们生产环境就是按照上述要求配置的，这样配置之后，至少在kafka broker端就可以保证在leader所在broker发生故障，进行leader切换时，数据不会丢失

3）生产者会不会弄丢数据

如果按照上述的思路设置了ack=all，一定不会丢，要求是，你的leader接收到消息，所有的follower都同步到了消息之后，才认为本次写成功了。如果没满足这个条件，生产者会自动不断的重试，重试无限次。