kafka offset的存储

最新推荐文章于 2024-01-15 10:16:01 发布

wjmmjr1

最新推荐文章于 2024-01-15 10:16:01 发布

阅读量1.1k

点赞数

分类专栏：大数据 kafka 文章标签： kafak offset

大数据同时被 2 个专栏收录

10 篇文章 1 订阅

订阅专栏

kafka

5 篇文章 0 订阅

订阅专栏

转自：https://www.cnblogs.com/smartloli/p/6266453.html

之前版本，Kafka其实存在一个比较大的隐患，就是利用 Zookeeper 来存储记录每个消费者/组的消费进度。目前，Kafka 官网已默认将消费的 offset 迁入到了 Kafka 一个名为 __consumer_offsets 的Topic中。它实现的原理是：利用 Kafka 自身的 Topic，以消费的Group，Topic，以及Partition做为组合 Key，所有的消费offset都提交写入到上述的Topic中。因为这部分消息是非常重要，以至于是不能容忍丢数据的，所以消息的 acking 级别设置为了 -1，生产者等到所有的 ISR 都收到消息后才会得到 ack（数据安全性极好，当然，其速度会有所影响）。所以 Kafka 又在内存中维护了一个关于 Group，Topic 和 Partition 的三元组来维护最新的 offset 信息，消费者获取最新的offset的时候会直接从内存中获取。

ISR机制:

kafka不是完全同步，也不是完全异步，是一种ISR机制：

1. leader会维护一个与其基本保持同步的Replica列表，该列表称为ISR(in-sync Replica)，每个Partition都会有一个ISR，而且是由leader动态维护
2. 如果一个flower比一个leader落后太多，或者超过一定时间未发起数据复制请求，则leader将其重ISR中移除

3. 当ISR中所有Replica都向Leader发送ACK时，leader才commit

ACK (Acknowledgement）即是确认字符，在数据通信中，接收站发给发送站的一种传输类控制字符。表示发来的数据已确认接收无误。

wjmmjr1

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
kafka offset的存储

转自：https://www.cnblogs.com/smartloli/p/6266453.html之前版本，Kafka其实存在一个比较大的隐患，就是利用 Zookeeper 来存储记录每个消费者/组的消费进度。目前，Kafka 官网已默认将消费的 offset 迁入到了 Kafka 一个名为 __consumer_offsets 的Topic中。它实现的原理是：利用 Kafka 自身的 Top...
复制链接

扫一扫

专栏目录