大数据-63 Kafka 高级特性分区副本机制宕机恢复 Leader选举

最新推荐文章于 2024-10-29 09:57:15 发布

武子康

最新推荐文章于 2024-10-29 09:57:15 发布

阅读量2k

点赞数 17

分类专栏：大数据文章标签：大数据 kafka 分布式架构 java

本文链接：https://blog.csdn.net/w776341482/article/details/140885169

版权

大数据专栏收录该内容

201 篇文章 27 订阅

订阅专栏

点一下关注吧！！！非常感谢！！持续更新！！！

目前已经更新到了：

Hadoop（已更完）
HDFS（已更完）
MapReduce（已更完）
Hive（已更完）
Flume（已更完）
Sqoop（已更完）
Zookeeper（已更完）
HBase（已更完）
Redis （已更完）
Kafka（正在更新…）

章节内容

上节我们完成了如下的内容，基本都是特性概念相关的：

kafka-topics.sh 的基本参数和基本使用，涉及到创建、查看、修改、主题，增加分区等。
KafkaAdminClient
Kafka偏移量管理

在这里插入图片描述

副本机制

在这里插入图片描述
Kafka在一定数量的服务器上对主题分区进行复制，当集群中一个Broker宕机之后们可以自动故障转移到其他可用的副本上，不会造成数据丢失。

将复制因子为1的未复制主题称为复制主题
主题的分区是复制的最小单元
在非故障的情况下，Kafka中的每个分区都由1个Leader副本，0个或N个Follower副本。
包括Leader副本在内的副本总数构成复制因子
所有读取和写入都是由Leader副本负责
通常分区比Broker多，并且Leader分区在Broker之间平均分配

Follower分区像普通的Kafka消费者一样，消费者来自Leader分区的消息，并将其持久化到自己的日志中，允许Follower对日志条目拉取进行批处理。

同步节点

节点必须能够维持ZooKeeper的会话（通过ZooKeeper的心跳机制）
对于Follower副本分区，它复制在Leader分区上的写入，并且不要延迟太多

Kafka提供的保证是：只要至少有一个同步副本处于活动状态，提交的消息就不会丢失。

宕机恢复

少副本宕机

当Leader宕机了，会从Follower选择一个作为Leader，当宕机重新恢复时，会把之前的commit清空，重新从Leader中Pull数据。

全副本宕机

恢复方式1：等待ISR中的一个恢复后，选为Leader（时间久，可用性低）
恢复方式2：选择一个恢复的副本作为新的Leader，无论是否在ISR中（可能未包含提交commit，会丢失数据）

Leader选举

3个分区
3个Broker

基础概念

在这里插入图片描述
生产者和消费者的请求都由Leader副本处理，Follower副本只负责Leader副本的数据和Leader保持同步。
Leader副本和Follower副本之间的关系并不是固定不变的，在Leader所在的Broker发生故障的时候，就需要进行分区的Leader副本和Follower副本之间的切换，需要选举Leader副本。