本章节是充分全面地了解 DataStream API,以便于编写流式应用入门。
1 什么能被转化成流?
Flink 的 Java 和 Scala DataStream API 可以将任何可序列化的对象转化为流。Flink 自带的序列化器有
- 基本类型,即 String、Long、Integer、Boolean、Array
- 复合类型:Tuples、POJOs 和 Scala case classes
而且 Flink 会交给 Kryo 序列化其他类型。也可以将其他序列化器和 Flink 一起使用。特别是有良好支持的 Avro。
2 Java tuples 和 POJOs
Flink 的原生序列化器可以高效地操作 tuples 和 POJOs
2.1 Tuples
对于 Java,Flink 自带有 Tuple0
到 Tuple25
类型。
Tuple2&l