kettle从入门到精通 第六十九课 ETL之kettle kettle cdc mysql,轻松实现增量同步

 1、之前kettle cdc mysql的时候使用的方案是canal+kafka+kettle,今天我们一起学习下使用kettle的插件Debezium直接cdc mysql。

 注:CDC (Change Data Capture) 是一种技术,用于捕获和同步数据库中的更改。

1)Debezium步骤解析mysql binlog日志。

2)json input步骤解析json字符串。

3)switch-case 根据op字段进行路由。

4)create、delete、update、ddl是写日志步骤,模拟后续操作。

2、Debezium步骤配置如下(只输出dml),更多属性配置参考Debezium官网。如下图所示:

 3、switch-case配置如下,不做过多介绍。

 4、binlog解析之后的dml语句对应的json字符串结构

CREATE

{
    "ts_ms": 1718273338000,
    "db": "test",
    "table": "t1",
    "op": "CREATE",
    "after": "{\"id\":6,\"name\":\"金刚葫芦娃\",\"createtime\":1718297698000}",
    "pk": "{\"id\":6}"
}

UPDATE

{
    "ts_ms": 1718273345000,
    "db": "test",
    "table": "t1",
    "op": "UPDATE",
    "before": "{\"id\":6,\"name\":\"金刚葫芦娃\",\"createtime\":1718297698000}",
    "after": "{\"id\":6,\"name\":\"金刚葫芦娃plus\",\"createtime\":1718297698000}",
    "pk": "{\"id\":6}"
}

DELETE

{
    "ts_ms": 1718273369000,
    "db": "test",
    "table": "t1",
    "op": "DELETE",
    "before": "{\"id\":6,\"name\":\"金刚葫芦娃plus\",\"createtime\":1718297698000}",
    "pk": "{\"id\":6}"
}

5、Debezium步骤配置中设置ddl为true(输出dml和ddl),更多属性配置参考Debezium官网。如下图所示:

 6、binlog解析之后的ddl语句对应的json字符串结构

DROP TABLE
{
    "ts_ms": 1718274150072,
    "db": "test",
    "table": "t3",
    "op": "ddl",
    "sql": "DROP TABLE `test`.`t3`"
}
CREATE TABLE
 
{
    "ts_ms": 1718274165789,
    "db": "test",
    "table": "t3",
    "op": "ddl",
    "ddl_type": "CREATE",
    "sql": "CREATE TABLE `t3` (\n `id` bigint NOT NULL AUTO_INCREMENT,\n `name` varchar(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL,\n `createtime` datetime DEFAULT NULL,\n PRIMARY KEY (`id`)\n ) ENGINE=InnoDB AUTO_INCREMENT=7 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci"
}


                
  • 5
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Kettle(Pentaho Data Integration)是一款开源的 ETL 工具,可以用于数据抽取、转换和加载。下面是 Kettle入门精通的一些步骤: 1. 下载并安装 Kettle 可以从官方网站下载 Kettle,然后按照提示安装即可。 2. 创建一个新的转换(Transformation) 在 Kettle 中,转换是指将原始数据转换为目标数据的一系列操作。要创建一个新的转换,可以在菜单栏中选择“文件”→“新建”→“转换”。 3. 添加输入源(Input) 在转换中,需要指定输入源,可以从各种数据源(如文件、数据库、Web 服务等)中读取数据。在 Kettle 中,可以通过“输入”组件来定义输入源。选择“输入”组件,然后在“设置”选项卡中输入相应的信息。 4. 添加转换步骤(Step) 在转换中,可以添加多个步骤来对数据进行转换、清洗、过滤等操作。在 Kettle 中,可以通过拖拽组件来添加转换步骤。例如,可以添加“文本文件输出”步骤来输出转换后的数据。 5. 运行转换 完成转换设置后,可以点击工具栏上的“运行”按钮来运行转换。Kettle 会根据设置的步骤依次执行,直至转换完成。 6. 高级应用 除了基本的数据转换外,Kettle 还支持更高级的功能,如作业(Job)、参数化、脚本等。通过学习和掌握这些高级功能,可以更加灵活地使用 Kettle 解决数据处理问题。 以上是 Kettle入门精通的一些基础步骤,希望能对你有所帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值