Kettle 入门级使用，案例教程

最新推荐文章于 2024-05-05 05:48:12 发布

等待中年危机

最新推荐文章于 2024-05-05 05:48:12 发布

阅读量578

点赞数

分类专栏：数据库同步文章标签： Kettle Kettle 入门

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_17230375/article/details/101596974

版权

数据库同步专栏收录该内容

2 篇文章 0 订阅

订阅专栏

前期工作准备：https://blog.csdn.net/xueruixuan/article/details/86488703

实战案例场景描述：
2个数据库跨库同步数据， 2个库的数据进行同步的新增、修改、删除

1：数据库模块
数据库A 为Mysql 数据库存在表Table1
数据库B 为Sqlserver 数据库存在表Table 2

每隔15分钟，将Table1的数据同步到Table 2的数据中

2：唯一性判断

2个表的数据唯一性都是依赖于主键GID （匹配字段）
2个表都是根据UpdateTime 和状态码、GID 3个条件判断数据的变化性（数据字段）

案例实战步骤
1. 配置完成数据库配置，如果大家在同一个作业里面都使用1个数据源，记得点击右键，数据共享

2. 搭建简易的流程
原始表：指的是数据来源的表
目标表：指的是将要同步的表

排序记录（划重点）：是为了解决后期2个表合并记录的时候准备使用的，原因是因为每次合并记录的时候，默认是按50000一一次存储到内存中，如果不提前排序，可能会导致 2个表的结果集合并记录时出现错误的情况，最后导致同步数据失败

字段选择：是为了解决 2个表跨库的过程中，数据库字段不一致的问题

合并记录（划重点）
匹配的关键字对比出2个数据库是否存在相同的记录（简单理解为判断是否新增的依据），
数据字典是对比2个数据库是否存在变化的记录，此字段需要根据业务场景来进行调整处理 PS：字段越多对比数据越慢

根据合并记录的数据行来执行对应的流程处理
注意：值千千万万一定要按这个上面的写，特别是changed，别写错了

后续的配置网上案例就比较多了，大家记得提交数据的时候，还是把批量更新可能会对数据库的压力更小一点

如果涉及到多表的同步，而且直接没有关联性的，可以尝试用下面这个方式进行

总结：
1. 文章写得很乱，没有流程而言，只有每个地方简单切图
2. 排序的细节点和合并记录的细节点非常非常重要
3. 自己也是初学者，无法跟大佬相比，如果更好的方案或者问题，请大佬指出。

等待中年危机

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。