在我们用FlinkCDC采集mysql数据(或其他数据源)的时候,FlinkCDC输出的格式不标准,不利于我们后续做数据处理,我们通常会使用自定义反序列化器来格式化采集数据方便后续处理
常规的反序列化器如下:
public class FlinkDataStreamCDC {
public static void main(String[] args) throws Exception {
//1.获取Flink 执行环境
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
env.setParallelism(1);
//2.通过FlinkCDC构建SourceFunction
DebeziumSourceFunction<String> sourceFunction = MySqlSource.<String>builder()
.hostname("192.168.0.0")
.port(3306)
.username("username")
.password("password")
.databaseList("cdc")
本文介绍了如何在使用Flink CDC采集MySQL数据时,通过自定义反序列化器来格式化输出数据,以便于后续处理。文章提供了一个具体的maven项目配置示例,展示了自定义反序列化器的实现代码,并展示了转换后的JSON格式数据,简化了数据提取和解析的难度。
订阅专栏 解锁全文
1781

被折叠的 条评论
为什么被折叠?



