Kettle 数据同步原始表和目标表的数据对比技术请教与讨论

最新推荐文章于 2024-05-14 15:00:00 发布

等待中年危机

最新推荐文章于 2024-05-14 15:00:00 发布

阅读量3.3k

点赞数 1

分类专栏：数据库同步文章标签： Kettle

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_17230375/article/details/101596652

版权

场景：
1. 2个数据库在做数据同步的传输，数据库A为 mysql 数据库B 为 sqlserver
2. 每次将数据库A的表table1 同步到数据库B的table2
3. 同步的时候是根据主键GID 为唯一性的判断， GID+时间+ 状态码是更新的判断依据
4. 同步数据的过程中，table 1 是根据查询的时间进行了条件过滤，因此 table 1 的数据行是有控制的

问题点：
1. 由于在数据同步的过程中，如果对table 2 进行统一的时间过滤时，会出现主键冲突，原因是： table1 的这个数据可能是上个月同步有一次，保留在table 2 里面一直是上个月的时间，但是今天突然发生了变化，如果加时间过滤的话，会导致没有查询到此结果集，最好以新增的形式同步过去，最终主键冲突

2：由于在问题1的情况下，导致了每次查询table2 的数据都是全量查询，因此，每次数据对比的时候耗时很大

解决方案点：
1. 能否将table 1 中查询的主键GID ，通过变量赋值的方式赋值到 table 2 中做查询，这样是不是每一次就可以控制table 2的查询结果集了

2 能否将table 1查询的结果集，直接插入到数据库B 的1个临时表，然后，table 2 和临时表做关联，也可以控制table2的查询结果集数量

疑惑点：
这2个方案的可行性如何，或者大佬们有没有更加好的方案？？

最低0.47元/天解锁文章

等待中年危机

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
Kettle 数据同步原始表和目标表的数据对比技术请教与讨论

场景：1. 2个数据库在做数据同步的传输，数据库A为 mysql 数据库B 为 sqlserver2. 每次将数据库A的表table1 同步到数据库B的table23. 同步的时候是根据主键GID 为唯一性的判断， GID+时间+ 状态码是更新的判断依据4. 同步数据的过程中，table 1 是根据查询的时间进行了条件过滤，因此 table 1 的数据行是有控制的问题点：...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。