Flink 自定义source和sink，获取kafka的key，输出指定key

最新推荐文章于 2024-07-28 03:42:13 发布

anfuyi5792

最新推荐文章于 2024-07-28 03:42:13 发布

阅读量3.4k

点赞数

文章标签：大数据 java json

原文链接：http://www.cnblogs.com/Springmoon-venn/p/11076636.html

版权

本文介绍了如何在Flink中通过自定义Source和Sink来处理Kafka数据的Key。由于Flink的标准FlinkKafkaConsumer和FlinkKafkaProducer不直接提供Key的访问，作者通过使用Kafka的原始API实现了获取和设置Key的功能。同时，文章提到了使用KafkaConsumer的低级API实现Source的精确一次处理，并讨论了在Sink中实现精确一次的挑战，引用了相关博客资源作为参考。

摘要由CSDN通过智能技术生成

--------20190905更新-------　　

沙雕了，可以用 JSONKeyValueDeserializationSchema，接收ObjectNode的数据，如果有key，会放在ObjectNode中

if (record.key() != null) {
            node.set("key", mapper.readValue(record.key(), JsonNode.class));
        }
        if (record.value() != null) {
            node.set("value", mapper.readValue(record.value(), JsonNode.class));
        }
        if (includeMetadata) {
            node.putObject("metadata")
                .put("offset", record.offset())
                .put("topic", record.topic())
                .put("partition", record.partition());
        }

-------------------

Flink 的 FlinkKafkaConsumer、FlinkKafkaProducer，在消费、生成kafka 数据的时候，不能指定key，又时候，我们又需要这个key。

val kafkaSource = new FlinkKafkaConsumer[ObjectNode]("kafka_demo", new JsonNodeDeserializationSchema(), Common.getProp)
    val sink = new FlinkKafkaProducer[String]("kafka_demo_out", new SimpleStringSchema(), Common.getProp)
    sink.setWriteTimestampToKafka(true)

    env.addSource(kafkaSource)
      .map(node => {
        node.put("token", System.currentTimeMillis())
        node.toString
      })
      .addSink(sink)

下面通过flink 的自定source、sink 实现，消费、生成kafka 数据的时候，获取数据的key ，和输出不同key的数据

思路：使用kafka 原生的api，KafkaConsuemr和KafkaProducer 消费、生产kafka的数据，就可以获取到key值

kafka 生产者：

object KafkaKeyMaker {
  val topic = "kafka_key"
  def main(args: Array[String]): Unit =

最低0.47元/天解锁文章

anfuyi5792

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫