Postgres CDC Connector — CDC Connectors for Apache Flink® documentation
flink cdc捕获postgresql数据
1)更改配置文件
需要更改
linux>vi postgresql.conf
# 更改wal日志方式为logical
wal_level = logical # minimal, replica, or logical
# 更改solts最大数量(默认值为10),flink-cdc默认一张表占用一个
slotsmax_replication_slots = 20 # max number of replication slots
# 更改wal发送最大进程数(默认值为10),这个值和上面的solts设置一样
max_wal_senders = 20 # max number of walsender processes
# 中断那些停止活动超过指定毫秒数的复制连接,可以适当设置大一点(默认60s)
wal_sender_timeout = 180s # in milliseconds; 0 disable
2)注意
注意:wal_level = logical源表的数据修改时,默认的逻辑复制流只包含历史记录的primary key,如果需要输出更新记录的历史记录的所有字段,需要在表级别修改参数:ALTER TABLE tableName REPLICA IDENTITY FULL; 这样才能捕获到源表所有字段更新后的值
3) 将jar包导入flink lib目录
flink-sql-connector-postgres-cdc-2.2.0.jar 到 flink/lib下
4)新建用户并且给用户复制流权限
-- pg新建用户
<

本文详细介绍了如何配置Postgres数据库以使用CDC(CaptureDataChange)功能与ApacheFlink集成。步骤包括修改Postgres的配置文件以启用logicalwal日志,创建用户并授予复制权限,导入Flink的JAR包,以及在FlinkSQL客户端中创建连接器。此外,还解决了可能出现的复制槽已存在的问题,并提供了Java代码示例来展示如何在Flink中读取CDC数据。
最低0.47元/天 解锁文章
892

被折叠的 条评论
为什么被折叠?



