因为基础API中地生产者,消费者,自定义分区,序列化,拦截器等等都是比较基础的知识,所以我们就先略过啦~
今天说的是kafka高级中的offset自动控制
offset自动控制
偏移量的首次消费策略
第一次访问kafka服务器的时候
Kafka消费者默认对于未订阅的topic的offset的时候,也就是系统并没有存储该消费者的消费分区的记录信息,默认Kafka消费者的默认首次消费策略:latest
auto.offset.reset=latest
- earliest -自动将偏移量重置为最早的偏移量
- latest -自动将偏移量重置为最新的偏移量
- none -如果未找到消费者组的先前偏移量,则向消费者抛出异常Kafka消费者在消费数据的时候默认会定期的提交消费的偏移量,这样就可以保证所有的消息至少可以被消费者消费1次,用户可以通过以下两个参数配置:
enable.auto.commit = true默认
auto.commit.interval.ms = 5000默认
如果用户需要自己管理offset的自动提交,可以关闭offset的自动提交,手动管理offset提交的偏移量,注意用户提交的offset偏移量永远都要比本次消费的偏移量+1,因为提交的offset是kafka消费者下一次抓取数据的位置。
测试:我们先使用生产者发送五条
latest 消费不到
earliest 可以消费得到
后续的消费行为都是一样的,消费者在消费后会自动提交偏移量
偏移量的自动提交问题
先
10秒以内关闭 再关再开 还可以拿到数据
关闭自动提交 就不会提交给kafka服务器了
下一节我们讲Acks&Retries~