利用kettle进行数据同步

最近工作上遇到数据同步场景就简单记录下
这里使用kettle9.0版本为例。
概述如下图
在这里插入图片描述
表输入步骤就简单说明下:
1.没有数据源就创建数据源在选择数据源
2.选择模式,当然你若是mysql就这一步当我没说哈。
3.写业务需要的最简字段的查询,当然若可以排序也最好按照业务需要排好顺即order by
下面分别来讲解这七个说明点。
说明1.排序:
说到排序就先将说明7说了哈。这里的源表—>字段选择其实你可以看作输入源(可以是多表关联也可以是单表哈,当然也可以是其他输入源的关联形成的哈)
这里的排序(包括源表和目标表)最好按照目标表的主键进行排序(方便进行合并记录)
在这里插入图片描述
说明2:字段选择
主要是将源表字段和目标表字段在类型和名称上保持一致。
在这里插入图片描述
说明3:合并记录
在这里插入图片描述
1.匹配的关键字段即目标表的逻辑主键字段集
2.数据字段即所有的需要的业务字段集
3.旧数据源即目标表的那一分支
3.新数据源即源表的那一分支
4.标记字段需要和业务字段不同名,在合并记录后标记字段有4种字符串类型的值

描述
deleted标记为删除的
new标记为新增的
changed标记为更新的
identical标记为未发生改变的

说明4:switch/case: 即依据标记字段进行分支
在这里插入图片描述
说明5:删除
在这里插入图片描述

说明6:插入更新
在这里插入图片描述
执行运行,效果如下图
在这里插入图片描述

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Kettle是一种用于数据集成和转换的开源工具,可以实现不同数据源之间的数据同步。根据引用\[1\]中的解决方案,可以使用Kettle的一些组件来实现数据同步。首先,需要使用表输入组件来输入最新的数据表和目标表。如果两个表的字段数据类型不一致,还需要添加字段选择组件进行转换。然后,对两个表进行排序操作,以便进行合并。接下来,使用合并记录组件根据ID进行合并。最后,使用数据同步组件实现数据的更新、插入和删除操作。点击运行即可实现数据同步。 另外,根据引用\[2\]中的定时清空目的数据源的方法,可以定期清空目的数据源,然后将源数据源的数据全盘拷贝到目的数据源。这种方法适用于数据量不大、实时性要求不高的场景。优点是不会对业务系统产生影响,开发和部署都比较简单,但效率较低。 总结起来,根据不同的需求和场景,可以选择不同的数据同步方式。其中,前四种方式需要业务表有主键,而对于没有触发器和日志的小型数据源,如txt文本、Excel文件和Access数据库,则只能使用后三种方式。对于大型数据源,一般优先选择日志方式,如Oracle Asynchronized CDC,如果无法通过日志实现,则可以考虑使用第1、3、4种方式。\[2\] 以MySQL数据库到Oracle数据库的定时同步为例,可以按照以下步骤进行操作:首先安装MySQL数据库和Oracle数据库,并下载Kettle工具。然后打开Kettle软件,根据需求清楚数据抽取需求,将MySQL数据库表和Oracle数据库表进行对应,根据Oracle的需求编写SQL语句,在MySQL中抽取相应的数据到Oracle。可以选择全量抽取或增量抽取,并设置定时任务来实现定时同步。\[3\] #### 引用[.reference_title] - *1* [kettle-数据同步](https://blog.csdn.net/qq_38882855/article/details/121930512)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [kettle数据同步的五种方案](https://blog.csdn.net/u011331383/article/details/10625701)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [利用kettle实现数据库之间的数据同步](https://blog.csdn.net/dream_girl5/article/details/120782397)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值