Kafka与ZooKeeper分手，真相令人震惊！

本文链接：https://blog.csdn.net/2401_84241227/article/details/138165802

Kafka原先是强依赖于ZooKeeper的，没有ZooKeeper的话Kafka都无法运行。ZooKeeper为Kafka提供了元数据的管理，例如一些Broker的信息、主题数据、分区数据等等。在每个Broker启动的时候，都会和ZooKeeper进行交互，这样ZooKeeper就存储了集群中所有的主题、配置、副本等信息。

然而，Kafka后来抛弃了ZooKeeper，原因可能是多方面的。首先，ZooKeeper本身的设计就存在一定的问题。比如，ZooKeeper在选举时整个ZooKeeper无法对外提供服务，这在异常情况下可能导致选举服务失效。其次，软件架构都是演进的，之所以要变更那肯定是因为出现了瓶颈。具体到Kafka和ZooKeeper的关系，可能是Kafka在规模扩大之后，遇到了无法克服的性能瓶颈，因此选择了替换ZooKeeper。

Java基础面试题【分布式】Kafka

简述Kafka架构设计

Consumer Group：消费者组，消费者组内每个消费者负责消费不同分区的数据，提高消费能力。逻辑上的一个订阅者。
Topic：可以理解为一个队列，Topic 将消息分类，生产者和消费者面向的是同一个 Topic。
Partition：为了实现扩展性，提高并发能力，一个Topic 以多个Partition的方式分布到多个 Broker 上，每个 Partition 是一个有序的队列。一个 Topic 的每个Partition都有若干个副本（Replica），一个 Leader 和若干个 Follower。生产者发送数据的对象，以及消费者消费数据的对象，都是 Leader。 Follower负责实时从 Leader 中同步数据，保持和 Leader 数据的同步。Leader 发生故障时，某个 Follower 还会成为新的 Leader。
Offset：消费者消费的位置信息，监控数据消费到什么位置，当消费者挂掉再重新恢复的时候，可以从消费位置继续消费。
Zookeeper：Kafka 集群能够正常工作，需要依赖于 Zookeeper，Zookeeper 帮助 Kafka 存储和管理集群信息。

Kafka在什么情况下会出现消息丢失及解决方案

消息发送

ack=0，不重试

producer发送消息完，不管结果了，如果发送失败也就丢失了。

**ack=1，leader crash **

producer发送消息完，只等待lead写入成功就返回了，leader crash了，这时follower没来及同步，消息丢失。

unclean.leader.election.enable 配置true

允许选举ISR以外的副本作为leader,会导致数据丢失，默认为false。producer发送异步消息完，只等待 lead写入成功就返回了，leader crash了，这时ISR中没有follower，leader从OSR中选举，因为OSR 中本来落后于Leader造成消息丢失。

解决方案：

配置：ack=all / -1,tries > 1,unclean.leader.election.enable : false

producer发送消息完，等待follower同步完再返回，如果异常则重试。副本的数量可能影响吞吐量。

不允许选举ISR以外的副本作为leader。

配置：min.insync.replicas > 1

副本指定必须确认写操作成功的最小副本数量。如果不能满足这个最小值，则生产者将引发一个异常(要么是 NotEnoughReplicas，要么是
NotEnoughReplicasAfterAppend)。

min.insync.replicas和ack更大的持久性保证。确保如果大多数副本没有收到写操作，则生产者将引发异常。

失败的offset单独记录

producer发送消息，会自动重试，遇到不可恢复异常会抛出，这时可以捕获异常记录到数据库或缓存，进行单独处理。

消费：

先commit再处理消息。如果在处理消息的时候异常了，但是offset 已经提交了，这条消息对于该消费者来说就是丢失了，再也不会消费到了。

broker的刷盘：

减小刷盘间隔

Kafka中zk的作用

/brokers/ids：临时节点，保存所有broker节点信息，存储broker的物理地址、版本信息、启动时间等，节点名称为brokerID，broker定时发送心跳到zk，如果断开则该brokerID会被删除

/brokers/topics：临时节点，节点保存broker节点下所有的topic信息，每一个topic节点下包含一个固定的partitions节点，partitions的子节点就是topic的分区，每个分区下保存一个state节点、保存着当前leader分区和ISR的brokerID，state节点由leader创建，若leader宕机该节点会被删除，直到有新的 leader选举产生、重新生成state节点

**/consumers/[group_id]/owners/[topic]/[broker_id-partition_id]**：维护消费者和分区的注册关系

**/consumers/[group_id]/offsets/[topic]/[broker_id-partition_id]**：分区消息的消费进度Offset

client通过topic找到topic树下的state节点、获取leader的brokerID，到broker树中找到broker的物理地址，但是client不会直连zk，而是通过配置的broker获取到zk中的信息