整理好了！2024年最常见 20 道 Kafka面试题（四）

最新推荐文章于 2024-08-14 12:36:02 发布

大料爱编程

最新推荐文章于 2024-08-14 12:36:02 发布

阅读量1k

点赞数 13

分类专栏： kafka 消息队列程序员面试文章标签： kafka 分布式面试后端跳槽中间件消息队列

本文链接：https://blog.csdn.net/weixin_38616368/article/details/139408257

版权

程序员面试同时被 3 个专栏收录

119 篇文章 0 订阅

订阅专栏

消息队列

20 篇文章 0 订阅

订阅专栏

kafka

10 篇文章 0 订阅

订阅专栏

上一篇地址：整理好了！2024年最常见 20 道 Kafka面试题（三）-CSDN博客

七、Kafka中的Offset是什么，它是如何管理的？

在Kafka中，Offset是一个非常重要的概念，它用于追踪消费者在主题中每个分区（Partition）的消费进度。以下是关于Kafka中Offset的详细解释以及它是如何被管理的：

Offset的定义：

消息位置标识：Offset是一个单调递增的整数，每个消息在Kafka的日志中都有一个唯一的Offset。它代表了消息在分区中的相对位置。
消费进度追踪：消费者使用Offset来记录它们已经消费到的消息。这样，消费者就可以在重新启动或者故障转移时，从上次停止的地方继续消费。

Offset的管理和作用：

自动提交：消费者可以配置为自动提交已消费消息的Offset。这意味着消费者在消费完一批消息后，会自动将这些消息的Offset发送给Kafka，以便在下次消费时从正确的位置开始。
手动提交：除了自动提交，消费者还可以手动提交Offset。这通常用于消费者需要在处理完一批消息后才提交Offset的场景，以确保消息的顺序性和完整性。
消费者组协调器：消费者组协调器（Group Coordinator）负责管理消费者组的状态，包括Offset的提交和查询。协调器确保了消费者组内所有消费者的Offset信息是同步和一致的。
消费者重启：当消费者重启时，它会向协调器查询当前的Offset。消费者可以选择从最新的Offset开始消费（忽略之前未处理的消息），或者从上次提交的Offset继续消费。
故障转移：在消费者实例故障时，Kafka会将该消费者正在消费的分区重新分配给消费者组内的其他消费者。新的消费者将从故障消费者最后提交的Offset开始消费。
消息丢失和重复：如果消费者在处理消息后没有提交Offset，并且随后发生了故障，那么在故障转移后，可能会发生消息重复消费的情况。相反，如果消费者提交了Offset但消息处理失败，可能会导致消息丢失。
Offset的持久性和安全性：Kafka将Offset存储在内部的Topic中，通常是名为__consumer_offsets的内部Topic。这个Topic由Kafka自动管理，确保了Offset的持久性和可靠性。
Offset监控和审计：管理员可以监控Offset的变化，以审计消费者的消费进度和行为。这有助于诊断问题，比如消费者延迟、故障或消息处理异常。
Offset的清理：Kafka提供了Offset清理策略，以避免Offset Topic变得过大。这包括根据时间或大小来删除旧的Offset记录。
Offset的自定义管理：在某些高级场景下，消费者可以自定义Offset的管理策略，例如，根据业务逻辑来决定何时提交Offset，或者使用外部存储来管理Offset。

总之，Offset是Kafka中用于追踪消费者消费进度的关键机制。通过合理地管理Offset，可以确保消息的可靠消费、顺序性和系统的容错性。

八、Kafka如何保证消息的可靠性？

Kafka是一个分布式流处理平台，它提供了多种机制来确保消息的可靠性。以下是Kafka保证消息可靠性的主要方式：

数据持久化：
- Kafka将接收到的消息存储在磁盘上的日志文件中，而不是仅仅存储在内存中。这确保了即使在服务器故障的情况下，消息也不会丢失。
数据复制：
- Kafka支持数据的副本复制。每个主题的分区都可以配置多个副本，其中有一个副本是领导者（Leader），其他副本是追随者（Follower）。追随者会从领导者那里同步数据。这样即使领导者发生故障，追随者中的一个可以被选举为新的领导者，继续提供服务。
领导者选举：
- 当领导者发生故障时，Kafka会通过ZooKeeper（在Kafka 2.8.0之前的版本中）或Kafka自身的Raft协议（在Kafka 2.8.0及以后的版本中）进行领导者选举，以确保始终有一个活跃的领导者提供服务。
消息确认：
- 生产者在发送消息时，可以设置确认模式。如果设置了相应的确认模式，生产者会在消息被成功写入所有指定的副本后才收到确认。这确保了消息的持久化。
消费者偏移量管理：
- Kafka允许消费者在成功处理消息后提交偏移量。这样，即使消费者发生故障，重启后也可以从上次提交的偏移量继续消费，从而避免消息的丢失或重复。
消费者组和分区：
- Kafka使用消费者组来管理消息的消费。每个消费者组内的消费者会分配到主题中不同分区的消息进行消费。如果一个消费者失败，它的分区可以被消费者组中的其他消费者接管。
数据压缩：
- Kafka支持数据压缩，这不仅可以减少网络传输的数据量，还可以减少磁盘空间的使用，同时压缩的数据在存储时会进行校验，确保数据的完整性。
数据加密：
- Kafka提供了数据加密的功能，可以在传输层（使用SSL）和存储层（使用文件系统加密）加密消息，以保护数据不被未授权访问。
端到端的完整性校验：
- Kafka可以配置消息的校验和，以确保在传输过程中消息没有被篡改。如果检测到消息损坏，Kafka可以丢弃这些消息。
生产者重试机制：
- 如果生产者在发送消息时遇到错误，它可以配置重试机制，尝试重新发送消息，直到成功为止。
消费者故障转移：
- Kafka的消费者组支持故障转移。如果一个消费者实例失败，它的工作可以被消费者组中的其他实例接管，以确保消息的持续消费。