【大数据开发】Flink——任意类型数据写入Kafka序列化方式

本文介绍了如何在Flink中创建KafkaProducer时使用自定义序列化方式,以处理除String类型之外的数据,如视频、图片和音频。示例展示了如何为JSONObject定制KafkaSerializationSchema,从JSONObject中提取特定字段并将其序列化到Kafka。
摘要由CSDN通过智能技术生成

Tips:需要传入自定义序列化方式,通常情况下我们都是使用StringSerializationSchema,但是该情况只能序列化String类型的数据,如果我们要序列化视频、图片、音频等格式,则需要自定义序列化方式

让调用者自定义序列化方式

    public static <T> FlinkKafkaProducer<T> getKafkaSinkBySchema(KafkaSerializationSchema<T> kafkaSerializationSchema) {
        Properties props = new Properties();
        props.setProperty(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG,KAFKA_SERVER);
        //设置生产数据的超时时间
        props.setProperty(ProducerConfig.TRANSACTION_TIMEOUT_CONFIG,15*60*1000+"");
        return new FlinkKafkaProducer<T>(DEFAULT_TOPIC, kafkaSerializationSchema, props, FlinkKafkaProducer.Semantic.EXACTLY_ONCE);
    }

如对JSONObject类型进行序列化

        FlinkKafkaProducer<JSONObject> kafkaSink = MyKafkaUtil.getKafkaSinkBySchema(
            new KafkaSerializationSchema<JSONObject>() {
                @Override
                public void open(SerializationSchema.InitializationContext context) throws Exception {
                    System.out.println("kafka序列化");
                }
                @Override
                public ProducerRecord<byte[], byte[]> serialize(JSONObject jsonObj, @Nullable Long timestamp) {
					// 获取Topic
                    String sinkTopic = jsonObj.getString("sink_table");
					// 从JSONObject对象中取出data字段,将data字段打入Kafka
                    JSONObject dataJsonObj = jsonObj.getJSONObject("data");
                    
                    // 需要传入 Topic 和 Value
                    return new ProducerRecord<>(sinkTopic,dataJsonObj.toString().getBytes());
                }
            }
        );
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值