记一次Flink写入Kafka坑点

王知无(import_bigdata)

已于 2022-07-11 21:22:16 修改

阅读量735

点赞数

分类专栏： Flink系统性学习专栏文章标签： kafka flink big data

于 2021-08-29 11:52:32 首次发布

原创文章禁止转载。否则追究法律后果。

本文链接：https://blog.csdn.net/u013411339/article/details/119978789

版权

Flink系统性学习专栏专栏收录该内容

256 篇文章 101 订阅 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

最近做了一个将结果数据写入到Kafka的需求，sink部分代码如下：

val kafkaProducer: FlinkKafkaProducer011[String] = new FlinkKafkaProducer011[String](
        sinkTopic, new StringKeyedSerializationSchema,producerConfig, sinkSemantic)
      ds.addSink(kafkaProducer).setParallelism(sinkParallelism)

其中StringKeyedSerializationSchema是自定义的实现KeyedSerializationSchema的序列化器，用于序列化写入kafka的key/value, 任务也上线了，在flink web页面看到任务各项指标一切正常，也测试消费写入kafka的数据，得到的结果也如预期一样，想着万事大吉了，so easy~ 过了一会kafka中间件的同事找过来说：你这个写入topic的数据怎么只有这几个分区，其他分区都没有数据写入

什么情况？任务看着一切都ok啊，怎么就有分区没有数据写入呢？马上google一下数据写入kafka的分区策略：

如果指定写入分区，就将数据写入分区
如果没有指定分区，指定了key, 那么就会按照key hash对分区取模方式发送
如果既没指定分区又没指定key,那么就会以轮序的方式发送

而实际情况是有几个分区一条数据都没有写入，并且在StringKeyedSerializationSchema也指定了每条写入数据的key, 那么就一定是第一种情况了，在FlinkKafkaProducer011中指定了数据写入的分区，马上翻看源码，在Flink

了解本专栏

超级会员免费看

王知无(import_bigdata)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
记一次Flink写入Kafka坑点

声明：本系列博客部分是根据SGG的视频整理而成，非常适合大家入门学习。部分文章是通过爬虫等技术手段采集的，目的是学习分享，如果有版权问题请留言，随时删除。《2021年最新版大数据面试题全面开启更新》最近做了一个将结果数据写入到Kafka的需求，sink部分代码如下：val kafkaProducer: FlinkKafkaProducer011[String] = new FlinkKafkaProducer011[String]( sinkTopic, new Strin
复制链接

扫一扫