Flink接收Kafka中的Avro序列化消息

最新推荐文章于 2024-06-07 01:13:43 发布

头顶榴莲树

最新推荐文章于 2024-06-07 01:13:43 发布

阅读量5.1k

点赞数

分类专栏：大数据文章标签： Flink

本文链接：https://blog.csdn.net/qq_32068809/article/details/103904917

版权

大数据专栏收录该内容

26 篇文章 4 订阅

订阅专栏

在Flink官网中可以看到flink接收kafka数据的简单示例程序

Properties properties = new Properties();
properties.setProperty("bootstrap.servers", "localhost:9092");
// only required for Kafka 0.8
properties.setProperty("zookeeper.connect", "localhost:2181");
properties.setProperty("group.id", "test");
DataStream<String> stream = env
	.addSource(new FlinkKafkaConsumer08<>("topic", new SimpleStringSchema(), properties));

这里传给FlinkKafkaConsumer08构造方法的第二个参数new SimpleStringSchema()即指定了从kafka获取消息后反序列化的方式为字符串序列化方式，当我们的kafka中消息是采用Avro实现序列化后，我们反序列化也要指定为采用Avro的方式，这里flink提供了一个叫做AvroDeserializationSchema的类，它可以实现Avro反序列化，实现方式示例如下：

首先创建这个Avro反序列化对象，通过forSpecific(User.class)方法指定需要序列化的实例类class为User.class（我的数据对象是User类实例）

AvroDeserializationSchema<User> UserSchema = AvroDeserializationSchema.forSpecific(User.class);

其中User类的实例就是我在kafka中传输的数据，这样添加source时就可以使用这个序列化对象了

DataStream<String> stream = env
.addSource(new FlinkKafkaConsumer08<>("topic", UserSchema, properties));

另外，Flink官网上说这个Avro序列化类不期望使用嵌套的数据结构（嵌套的schema）,原话：This deserialization schema expects that the serialized records DO NOT contain embedded schema.

但是我的User类里还嵌套了个类，使用起来也能正常解析，没发现问题

头顶榴莲树

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
9
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录