Kafka中的Offset偏移量+新老版本偏移量位置的改动

我们Kafka中的message,既然是写在XXXXXX.log文件中,不管存了多少数据,只要超过1G大小,就又开启一个新的Log文件存message,文件内部分多个segment分段(可以配置)。

在这里插入图片描述

文件命名就是segment分段的起始位置命名,例如:

第一个segment分段:0000000000.log(包含message0~37)、第二个segment分段0000000038.log(包含message38~75)、第三个segment分段00000000076.log(包含message76~113)… 第N个segment分段0000000369.log (包含message N-37~N),偏移量可以想象是书签,消费者重启后,继续从那一次消费的起点开始读取,例如假如上一次消费者A的偏移量是0000000029,证明消费到了29,掉线了,或者停止服务重启后就从0000000030开始消费,于是通过二分查找,发现30的message还属于segment 1这个分段,于是进入segment 1 继续二分,直到找到message 30。

上例子:
老版本Kafka(0.9以前)都存在ZooKeeper当中,之后的新版本都存在Kafka自带的一个偏移量主题当中:
查看当前Kafka的所有topics:
./kafka-topics.sh --list --zookeeper localhost:2181

在这里插入图片描述

可以看到确实有个偏移量的主题,文件的位置如果不做数据日志与系统日志分离,默认在Kafka内的logs,我的环境重新配置在了/kafka-logs文件夹中:

在这里插入图片描述

0~49,都是用来存消费者偏移量的主题文件。
我们自定义主题也会在这里出现:
.
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Kafka偏移量offset)是用来标识消费者在一个特定分区已经消费的消息的位置Kafka提供了两种方式来存取偏移量:使用内部存储和外部存储。 1. 内部存储:Kafka内部使用一个特殊的主题(__consumer_offsets)来存储消费者的偏移量信息。每个消费者组在该主题会有一个对应的分区来保存其消费的偏移量Kafka集群会自动维护和管理这个主题,确保偏移量的持久化和一致性。 2. 外部存储:除了使用内部存储方式,Kafka还支持将偏移量存储在外部系统,如ZooKeeper或自定义的存储系统。在这种情况下,消费者需要自己负责管理和维护偏移量的存储和读取。 使用内部存储方式时,消费者可以通过以下步骤来存取偏移量: - 初始化消费者时,指定所属的消费者组和要消费的主题。 - 消费者在处理每条消息后,会自动将消费的偏移量提交给Kafka集群。这可以通过自动提交或手动提交来实现。 - 自动提交:消费者会定期将偏移量提交给Kafka,由Kafka集群负责管理提交的偏移量。 - 手动提交:消费者可以在适当的时机手动提交偏移量,以确保消息被正确消费。手动提交可以选择同步提交或异步提交。 使用外部存储方式时,消费者需要自己实现偏移量的存储和读取逻辑。一般情况下,消费者会使用外部存储系统提供的API来操作偏移量。 总之,Kafka提供了内部存储和外部存储两种方式来存取偏移量,可以根据实际需求选择适合的方式。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值