flink关于 kafka source 偏移量

胖胖胖胖胖虎

已于 2023-02-18 22:32:55 修改

阅读量1.4k

点赞数 1

分类专栏： Kafka Flink 文章标签： kafka flink java

于 2022-11-06 11:49:55 首次发布

原文链接：https://developer.aliyun.com/ask/361651

版权

Flink 同时被 2 个专栏收录

27 篇文章 0 订阅

订阅专栏

Kafka

16 篇文章 1 订阅

订阅专栏

转自：https://developer.aliyun.com/ask/361651

按照官方文档的kafka source部分，有如下配置说明：

scan.startup.mode : optionalgroup-offsetsStringStartup mode for Kafka

consumer, valid values are ‘earliest-offset’, ‘latest-offset’, ‘group-offsets’, ‘timestamp’ and ‘specific-offsets’. See the following

Start Reading Position for more details.

其中Reading Positions部分说明如下：

The config option scan.startup.mode specifies the startup mode for Kafka consumer. The valid enumerations are:

group-offsets: start from committed offsets in ZK / Kafka brokers of a specific consumer group.

earliest-offset: start from the earliest offset possible.

latest-offset: start from the latest offset.

timestamp: start from user-supplied timestamp for each partition.

specific-offsets: start from user-supplied specific offsets for each partition.

可见，latest-offset和group-offsets是2个配置，所以我配置 latest-offset 肯定是从最新部分开始消费的，而不管使用的说明 group id，以及这个group id 已提交的offset，这个估计没问题。

然后我想知道的是：带有latest-offset这个配置的情况下，sql任务自动重启基于检查点是从最新消费，还是基于检查点的offset消费？

对于flink stream中实现，是从checkpoint offset 的
flinksql 也是会从上一次成功的 checkpoint 中保存的 offset 位置开始恢复数据的

DataStream API

### 如果是从checkpoint中恢复的，取得是checkpoint offset
### 如果不是checkpoint恢复的，取得是 kafka 保存的offset
consumerprops.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");

胖胖胖胖胖虎

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
flink关于 kafka source 偏移量

flink kafka 偏移量
复制链接

扫一扫

专栏目录

flink关于 kafka source 偏移量

DataStream API

“相关推荐”对你有帮助么？