整理好了！2024年最常见 20 道 Kafka面试题（八）

最新推荐文章于 2024-08-14 12:36:02 发布

大料爱编程

最新推荐文章于 2024-08-14 12:36:02 发布

阅读量775

点赞数 28

分类专栏： kafka 消息队列程序员面试文章标签： kafka 分布式后端跳槽面试中间件消息队列

本文链接：https://blog.csdn.net/weixin_38616368/article/details/139461228

版权

程序员面试同时被 3 个专栏收录

119 篇文章 0 订阅

订阅专栏

消息队列

20 篇文章 0 订阅

订阅专栏

kafka

10 篇文章 0 订阅

订阅专栏

上一篇地址：整理好了！2024年最常见 20 道 Kafka面试题（七）-CSDN博客

十五、Kafka 与传统 MQ 消息系统之间有什么区别？

Kafka与传统的消息队列（MQ）系统有多个显著的区别，这些区别主要体现在以下几个方面：

数据模型：
- Kafka：Kafka是一个分布式流处理平台，它使用发布-订阅模式来处理数据流。它将数据以流的形式存储在主题（Topics）中，主题可以被视为消息队列。
- 传统MQ：传统消息队列系统通常使用点对点模型，消息被发送到队列中，然后被消费者从队列中取出。这种方式更侧重于一对一或一对多的消息传递。
持久化：
- Kafka：Kafka将消息持久化存储在磁盘上，支持高吞吐量的读写操作，并且可以配置消息的保留策略。
- 传统MQ：传统MQ也支持消息的持久化，但通常更侧重于内存中的消息处理，以提高响应速度。
可扩展性：
- Kafka：Kafka设计为易于扩展，可以通过简单地增加更多的Broker节点来水平扩展。
- 传统MQ：传统MQ系统可能在扩展性上不如Kafka灵活，扩展通常涉及到更复杂的配置和资源管理。
吞吐量和性能：
- Kafka：Kafka设计用于高吞吐量的消息处理，特别是在大数据场景下，它能够处理每秒数百万条消息。
- 传统MQ：传统MQ系统在处理高吞吐量消息时可能不如Kafka高效，尤其是在分布式环境中。
容错性和可靠性：
- Kafka：Kafka提供了高容错性，通过副本（Replicas）和分区（Partitions）来确保消息的可靠性。
- 传统MQ：传统MQ系统可能提供不同的容错机制，例如事务队列和持久化消息，但可能不如Kafka的副本和分区机制强大。
消息传递语义：
- Kafka：Kafka支持最多一次（At Most Once）、最少一次（At Least Once）和精确一次（Exactly Once）的传递语义。
- 传统MQ：传统MQ系统可能支持不同的消息传递保证，例如事务性消息传递，但可能不支持精确一次语义。
消费者模型：
- Kafka：Kafka支持消费者组（Consumer Groups），允许多个消费者实例并行地消费消息，并且可以自动平衡负载。
- 传统MQ：传统MQ通常支持点对点的消息传递，消费者之间没有自动负载平衡。
集成和生态系统：
- Kafka：Kafka是Apache软件基金会的项目，拥有庞大的生态系统和社区支持，与许多大数据工具和平台（如Spark、Flink、Hadoop等）紧密集成。
- 传统MQ：传统MQ系统可能拥有自己的一套工具和集成方式，但可能不如Kafka的生态系统广泛。
监控和管理：
- Kafka：Kafka提供了JMX（Java Management Extensions）和其他工具来监控和管理集群。
- 传统MQ：传统MQ系统可能有自己的管理界面和监控工具。
成本和维护：
- Kafka：作为一个开源解决方案，Kafka可以降低成本，但可能需要更多的专业知识来维护和优化。
- 传统MQ：商业MQ解决方案可能需要购买许可证，但通常提供专业的支持和服务。

综上所述，Kafka与传统MQ系统在设计理念、性能、可扩展性、容错性、消费者模型和生态系统等方面都有显著的区别。这些区别使得Kafka在处理大规模数据流和实时数据处理方面具有独特的优势。

十六、Kafka 的 ack 机制有哪几种，它们是如何工作的？

Kafka的ack（Acknowledgement，确认机制）是消息确认机制，用于确保生产者发送的消息被Kafka集群正确处理。Kafka提供了三种不同的ack级别，它们决定了生产者在发送消息后等待Broker确认的方式：

acks=0：无确认（No Acknowledgment）
- 在这种模式下，生产者不会等待来自Broker的任何确认就认为消息已经发送成功。
- 这种设置可以提供最高的吞吐量，因为生产者发送消息后立即继续发送下一条消息，而不需要等待网络延迟。
- 但是，如果Broker在接收到消息之前发生故障，那么消息可能会丢失。
acks=1：单节点确认（Leader Acknowledgment）
- 当设置为acks=1时，生产者在发送消息后会等待来自Leader Broker（即负责消息所属分区的主节点）的确认。
- 这意味着只要Leader Broker接收到消息，生产者就会认为消息发送成功。
- 这种模式下的消息丢失风险较低，因为Leader Broker已经确保消息被写入，但在Leader Broker写入消息到磁盘后但在发送确认之前如果发生故障，消息可能会丢失。
acks=all（或acks=-1）：所有副本确认（All Replicas Acknowledgment）
- 这是最强的确认级别，生产者会等待所有同步副本（ISR，In-Sync Replicas）都确认接收到消息后才认为消息发送成功。
- ISR是指那些与Leader保持同步的副本，它们会将消息写入自己的日志中，并确认给Leader。
- 这种模式下，即使Leader Broker发生故障，由于已经有副本同步了消息，所以消息不会丢失，从而提供了最高的数据耐久性。
- 然而，这种模式会降低吞吐量，因为生产者需要等待所有副本的确认，这增加了延迟。
acks=leader（Kafka 2.8.0之后引入）：
- 当设置为acks=leader时，生产者将等待Leader Broker的确认，但不关心ISR中的其他副本。
- 这个设置在某些场景下可以提供比acks=1更高的吞吐量，因为生产者不需要等待所有副本的确认，但仍然保证了消息不会因为Leader的故障而丢失。