kafka的副本机制

最新推荐文章于 2024-09-03 15:01:25 发布

Crazy丶Mark

最新推荐文章于 2024-09-03 15:01:25 发布

阅读量9.1k

点赞数 5

分类专栏： kafka那些事文章标签： kafka replica

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39907763/article/details/82697452

版权

kafka那些事专栏收录该内容

5 篇文章 1 订阅

订阅专栏

partition的副本被称为replica，每个分区可以有多个副本，并且在副本集中会存在一个leader副本，所有的读写请求都会通过leader完成，follower复制只负责备份数据。

副本会均匀分配到多台broker上，当leader节点挂掉之后，会从副本集中重新选出一个副本作为leader继续提供服务

副本分配算法：

n个broker
将第i个partition的第j个副本分配到第（（i+j）mod n）个broker上

kafka副本机制中的概念：

leader副本：响应客户端的读写请求
follow副本：备份leader的数据，不进行读写操作
ISR副本：leader副本和所有能够与leader副本保持基本同步的follow副本，如果follow副本和leader副本数据同步速度过慢，该follow将会被T出ISR副本

ISR集合中的副本必须满足的条件：

副本所在的节点与zk相连
副本的最后一条消息和leader副本的最后一条消息的差值不能超过阈值replica.lag.time.max.ms:如果该follower在此时间间隔之内没有追上leader,则该follower将会被T出ISR

副本同步时的两个重要概念

LEO（Last end offset）记录了该副本底层日志中的下一条消息的offset，例如LEO为10，那么当前的offset为9
HW （High water）标记着可消费的消息，对于同一个副本而言HW不会大于LEO，小于等于HW的消息将会被认为是已备份的。

副本协同机制

producer将消息发送到该partition的leader上，leader会把消息写入其本地log，每个follower都从leader pull数据。在follower收到消息并且将消息写入本地log之后会向leader发送ack，一旦leader收到了ISR中所有replica的ACK，该消息就被认为已经commit了，leader会增加HW并向producer发送ACK

过程如下所示
这里写图片描述

follower发送fetch请求，并带上自己的LEO
leader端的操作
1.当producer发送一个消息给leader之后，leader会把消息写入磁盘
2.然后leader会更新LEO，这时候尝试更新HW，HW是取LEO和remoteLEO的较小值，这时候HW依然为0.（remoteLEO取所有Follower发过来的offset中最小的一个）
3.把消息内容和当前的HW值发送给follower副本

当收到响应之后，follower端的操作
1.将消息写入本地log，同时更新LEO
2.比较本地LEO和返回的HW,比较他们取小值赋值给HW

第二次发送fetch请求之后
这里写图片描述

leader
1.更新remoteLEO=1
2.更新HW为1
3.把数据和当前HW返回给follower，如果这时候没有数据，则返回空

follower收到response之后
1.如果有数据则写入本地日志，并且更新LEO
2.更新HW的值
到目前为止，consumer就可以消费offset=0的消息了

关注

5
点赞
踩
15

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Crazy丶Mark CSDN认证博客专家 CSDN认证企业博客

码龄7年

41: 原创

105万+: 周排名

222万+: 总排名

13万+: 访问

: 等级

1516: 积分

27: 粉丝

71: 获赞

43: 评论

243: 收藏

私信

关注

热门文章

分类专栏

最新评论

JDK1.8接口的默认实现
qq_45387173: 他的这个默认方法用起来更方便了
kafka的分区分配策略
weixin_41948614: https://www.cnblogs.com/wangjing666/p/10283920.html推荐大家看这篇文章吧
kafka的分区分配策略
weixin_41948614: 采用RoundRobin每个消费者订阅的主题必须相同。。。
kafka的分区分配策略
Stephen_Lee98: 我感觉还行啊，是还有哪些知识点没提吗
为什么wait,notify和notifyAll要与synchronized一起使用？
我来自东和西啊1: 我来给结论：为什么？因为wait表示释放锁，如果没有sychronized，怎么知道释放的是什么锁？还有notify/notifyAll，表示：唤醒在该对象锁等待的队列中的线程，如果没有sychronized，怎么知道要去哪个对应的阻塞队列上唤醒？

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。