Kafka从入门到精通（八）Kafka原理

最新推荐文章于 2024-09-04 01:20:20 发布

TPH-BETTER

最新推荐文章于 2024-09-04 01:20:20 发布

阅读量491

点赞数

分类专栏：大数据文章标签： kafka 分布式 big data

本文链接：https://blog.csdn.net/weixin_46055693/article/details/124863722

版权

大数据专栏收录该内容

12 篇文章 3 订阅

订阅专栏

1. 监控工具Kafka-eagle介绍

省略

2. Kafka原理

2.1 分区的leader与follower

2.1.1 Leader和Follower

在Kafka中，每个topic都可以配置多个分区以及多个副本。每个分区都有一个leader以及0个或者多个follower，在创建topic时，Kafka会将每个分区的leader均匀地分配在每个broker上。我们正常使用kafka是感觉不到leader、follower的存在的。但其实，所有的读写操作都是由leader处理，而所有的follower都复制leader的日志数据文件，如果leader出现故障时，follower就会被选举为leader。所以，可以这样说：

Kafka中的leader负责处理读写操作，而follower只负责副本数据的同步
如果leader出现故障，其他follower会被重新选举为leader
follower像一个consumer一样，拉取leader对应分区的数据，并保存到日志数据文件中

在这里插入图片描述
总结：

Kafka中的leader和follower是相对分区有意义，不是相对broker
Kafka在创建topic的时候，会尽量分配分区的leader在不同的broker中，其实就是负载均衡
leader职责：读写数据
follower职责：同步数据、参与选举（leader crash之后，会选举一个follower重新成为分区的leader
注意和ZooKeeper区分
- ZK的leader负责读、写，follower可以读取
- Kafka的leader负责读写、follower不能读写数据（确保每个消费者消费的数据是一致的），Kafka一个topic有多个分区leader，一样可以实现数据操作的负载均衡

2.1.2 查看某个partition的leader

在这里插入图片描述

2.1.3 AR、ISR、OSR

在实际环境中，leader有可能会出现一些故障，所以Kafka一定会选举出新的leader。在讲解leader选举之前，我们先要明确几个概念。Kafka中，把follower可以按照不同状态分为三类——AR、ISR、OSR。

分区的所有副本称为「AR」（Assigned Replicas——已分配的副本）
所有与leader副本保持一定程度同步的副本（包括 leader 副本在内）组成「ISR」（In-Sync Replicas——在同步中的副本）
由于follower副本同步滞后过多的副本（不包括 leader 副本）组成「OSR」（Out-of-Sync Replias）
AR = ISR + OSR
正常情况下，所有的follower副本都应该与leader副本保持同步，即AR = ISR，OSR集合为空。

2.1.4 查看分区的ISR

使用Kafka Eagle/Kafka Manager查看某个Topic的partition的ISR有哪几个节点。
尝试关闭id为0的broker（杀掉该broker的进程），参看topic的ISR情况。
![在这里插入图片描述](https://img-blog.csdnimg.cn/c05682c32e194f8895156bada44091f6.png

2.1.5 Leader选举

leader对于消息的写入以及读取是非常关键的，此时有两个疑问：

Kafka如何确定某个partition是leader、哪个partition是follower呢？
某个leader崩溃了，如何快速确定另外一个leader呢？因为Kafka的吞吐量很高、延迟很低，所以选举leader必须非常快

2.1.5.1 如果leader崩溃，Kafka会如何？

使用Kafka Eagle/Kafka Manager找到某个partition的leader，再找到leader所在的broker。在Linux中强制杀掉该Kafka的进程，然后观察leader的情况。
在这里插入图片描述通过观察，我们发现，leader在崩溃后，Kafka又从其他的follower中快速选举出来了leader。

2.1.5.2 Controller介绍

Kafka启动时，会在所有的broker中选择一个controller
前面leader和follower是针对partition，而controller是针对broker的
创建topic、或者添加分区、修改副本数量之类的管理任务都是由controller完成的
Kafka分区leader的选举，也是由controller决定的

2.1.5.3 Controller的选举

在Kafka集群启动的时候，每个broker都会尝试去ZooKeeper上注册成为Controller（ZK临时节点）
但只有一个竞争成功，其他的broker会注册该节点的监视器
一点该临时节点状态发生变化，就可以进行相应的处理
Controller也是高可用的，一旦某个broker崩溃，其他的broker会重新注册为Controller

2.1.5.4 找到当前Kafka集群的controller

点击Kafka Tools的「Tools」菜单，找到「ZooKeeper Brower…」
点击左侧树形结构的controller节点，就可以查看到哪个broker是controller了。

2.1.5.5 测试controller选举

在这里插入图片描述

2.1.5.6 Controller选举partition leader

所有Partition的leader选举都由controller决定
controller会将leader的改变直接通过RPC的方式通知需为此作出响应的Broker
controller读取到当前分区的ISR，只要有一个Replica还幸存，就选择其中一个作为leader
如果该partition的所有Replica都已经宕机，则新的leader为-1

partition的leader平衡工具的引入
为了能让partition和replica均匀的分布在broker上，防止一台机器负载较高。有如下分配算法：

将所有N Broker和待分配的i个Partition排序.
将第i个Partition分配到第(i mod n)个Broker上.
将第i个Partition的第j个副本分配到第((i + j) mod n)个Broker上
topic初始创建后，就会符合上述分配。

为什么不能通过ZK的方式来选举partition的leader？

Kafka集群如果业务很多的情况下，会有很多的partition
假设某个broker宕机，就会出现很多的partiton都需要重新选举leader
如果使用zookeeper选举leader，会给zookeeper带来巨大的压力。所以，kafka中leader的选举不能使用ZK来实现。

2.1.6 leader负载均衡

2.1.6.1 Preferred Replica

Kafka中引入了一个叫做「preferred-replica」的概念，意思就是：优先的Replica
在ISR列表中，第一个replica就是preferred-replica
第一个分区存放的broker，肯定就是preferred-replica
执行以下脚本可以将preferred-replica设置为leader，均匀分配每个分区的leader。

引入preferred-replica概念，ISR列表里，第一个replica就是preferred-replica。broker宕机后变为follower，但是ISR的preferred-replica一直不会变，执行kafka-preferred-replica-election.sh脚本就是把****preferred-replica选为leader的过程。

kafka-preferred-replica-election.sh --zookeeper node1:2181,node2:2181,node3:2181

TPH-BETTER

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录