Kafka系列之:深入理解Kafka 主题、分区、副本、LEO、ISR、HW、Kafka的主写主读和分区leader选举

550 篇文章 555 订阅 ¥49.90 ¥99.00
61 篇文章 23 订阅 ¥39.90 ¥99.00
本文详细介绍了Kafka的主题、分区、副本、LEO(Log End Offset)、ISR(In-Sync Replicas)和HW(High Watermark)。解释了副本的冗余作用,以及主副本和从副本的角色。Kafka通过多副本机制确保容灾能力,当leader副本故障时,ISR中的follower副本可晋升为新的leader。LEO和HW决定了消费者能消费到的消息范围,而ISR的动态调整平衡了数据可靠性和性能。分区leader的选举由控制器负责,确保了系统的高效运行。
摘要由CSDN通过智能技术生成

一、Kafka重要知识点提炼

  • 副本指的是分布式系统对数据和服务提供的一种冗余方式。
  • 数据副本是指在不同的节点上持久化同一份数据,当某一个节点上存储的数据丢失时,可以从副本上读取该数据,这是解决分布式系统数据丢失问题最有效的手段。
  • 服务副本上指多个节点提供同样的服务,每个节点都有能力接收来自外部的请求并进行相应的处理。

介绍与副本相关的AR、ISR、HW和LEO的概念:

  • 副本是相对分区而言的,即副本是特定分区的副本
  • 一个分区位于不同的broker节点中,只有leader副本对外提供服务,follower副本只负责数据同步。
  • 分区中的所有副本统称为AR,而ISR是指与leader副本保持同步状态的副本集合,当然leader副本本身也是这个集合中的一员。
  • LEO标识每个分区中最后一条消息的下一个位置,分区的每个副本都有自己的LEO,ISR中最小的LEO即为HW,俗称高水位,消费者只能拉取到HW之前的消息。

从生产者发出的一条消息首先会被写入分区的leader副本,不过还需要等待ISR集合中的所有follower副本都同步完之后才能被认为已经提交,之后才会更新分区的HW,进而消费者可以消费到这条消息。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

快乐骑行^_^

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值