Flink 源码分析之 Flink 是如何 kafka 读取数据的

最新推荐文章于 2023-08-11 18:14:52 发布

哥伦布112

最新推荐文章于 2023-08-11 18:14:52 发布

阅读量651

点赞数

分类专栏： flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013939918/article/details/107704546

版权

本文深入探讨了 Flink 从 Kafka 源中读取数据的过程，从 FlinkKafkaConsumerBase 的 run 方法开始，详细介绍了 createFetcher 方法、KafkaFetcher 的构造及工作原理，特别是 KafkaConsumerThread 如何启动并进行数据拉取。在拉取过程中，包括了 offset 的提交、新分区的处理等关键步骤。

摘要由CSDN通过智能技术生成

首先来看一下 FlinkKafkaConsumerBase.run方法，相当于是Flink 从kafka中拉取数据的入口方法:

//入口方法 start a source

public void run(SourceContext<T> sourceContext) throws Exception {

......

// from this point forward:

// - 'snapshotState' will draw offsets from the fetcher,

// instead of being built from `subscribedPartitionsToStartOffsets`

// - 'notifyCheckpointComplete' will start to do work (i.e. commit offsets to

// Kafka through the fetcher, if configured to do so)

//创建Fetcher 从kafka中拉取数据

this.kafkaFetcher = createFetcher(

sourceContext,

subscribedPartitionsToStartOffsets,

periodicWatermarkAssigner,

punctuatedWatermarkAssigner,

(StreamingRuntimeContext) getRuntimeContext(),

offsetCommitMode,

getRuntimeContext().getMetricGroup().addGroup(KAFKA_CONSUMER_METRICS_GROUP),

useMetrics);

if (!running) {

return;

}

// depending on whether we were restored with the current state version (1.3),

// remaining logic branches off into 2 paths:

// 1) New state - partition discovery loop executed as separate thread, with this

// thread running the main fetcher loop

// 2) Old state - partition discovery is disabled and only the main fetcher loop is executed

if (discoveryIntervalMillis == PARTITION_DISCOVERY_DISABLED) {

//未配置KEY_PARTITION_DISCOVERY_INTERVAL_MILLIS

kafkaFetcher.runFetchLoop();

} else {

//仍然调用了kafkaFetcher.runFetchLoop();

runWithPartitionDiscovery();

}

}

createFetcher方法

@Override

protected AbstractFetcher<T, ?> createFetcher(

SourceContext<T> sourceContext,

Map<KafkaTopicPartition, Long> assignedPartitionsWithInitialOffsets,

SerializedValue<AssignerWithPeriodicWatermarks<T>> watermarksPeriodic,

SerializedValue<AssignerWithPunctuatedWatermarks<T>> watermarksPunctuated,

StreamingRuntimeContext runtimeContext,

OffsetCommitMode offsetCommitMode,

Metr

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。