kafka的replica机制能保证不丢数据吗

最新推荐文章于 2024-03-12 12:31:57 发布

千淘万漉

最新推荐文章于 2024-03-12 12:31:57 发布

阅读量532

点赞数 1

分类专栏：云计算/大数据文章标签： kafka replica 丢数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/matrix_google/article/details/93632506

版权

不能

kafka的replica机制完美的在可用性和一致性之间做了平衡，但是他仍然有丢失数据的风险

消息写入主分片后，flowers会定时来拉取，如果超过时间都不来拉，直接就判定他死了，直接从isr中踢出去

如果拉的太慢，相比主分片有较大延迟，比如副本分片所有的broker有gc异常，超过一个阈值认为是慢follower，也可以踢出去

比如这个阈值设置为10，凡是延迟在10以内的都是isr成员，只有他们全都到主分片拉到消息，这条消息才能commit

高可用体现在哪呢？

相比于所有副本拉到消息才commit，isr甚至可以把所有follower都踢掉，极端情况下只要维护一个主分片

最大效率的保证同步速度

为啥会丢失数据呢？

数据写入主分片后，followers还没有跟上，主分片上这时候会多几条数据，这几条数据因为没有被拉到follower，导致不能commit

此时如果主分片所在的broker宕机，没有提交的这几条消息就丢了

如何保证严格数据不丢失？

同步发送，每条消息收到ack之后再发送下一条，收不到ack就一直重试，直到开发者意识到

问题

同步发送效率太低，异步批量发送才能保证效率

如何兼顾效率和不丢失数据？

最终一致性和补偿机制

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
kafka的replica机制能保证不丢数据吗

不能kafka的replica机制完美的在可用性和一致性之间做了平衡，但是他仍然有丢失数据的风险消息写入主分片后，flowers会定时来拉取，如果超过时间都不来拉，直接就判定他死了，直接从isr中踢出去如果拉的太慢，相比主分片有较大延迟，比如副本分片所有的broker有gc异常，超过一个阈值认为是慢follower，也可以踢出去比如这个阈值设置为10，凡是延迟在10以内的都是isr...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。