我又尝试了下使用kettle去做同步数据。使用心得:kettle适合快速上手,在增量同步上比datax灵活,但是会比较笨重,各有各的好处吧。
kettle安装操作:
- 系统:windows
- kettle版本:8.3
- 下载kettle源码并解压:git clone https://github.com/pentaho/pentaho-kettle.git
- 在data-integration目录下点击spoon.bat,即可打开kettle的图形化工具
kettle使用步骤:
1. 建立两个文件:一个转换 命名为getTransfer.ktr,一个作业 命名为sync.kjb
2. getTransfer.ktr 流程图,表输入+ 插入/更新,建立节点连接
建立节点连接后 ----->
表输入编辑:SQL下要写一条查询语句
表输入编辑:数据库连接----> 因为是从postgresql读取数据,所以这里连接的是postgresql数据库
插入/更新编辑: 数据库连接sqlserver,编辑目标表,关键字及更新字段
3. 定时作业sync.kjb 的流程图,start + 转换 + 成功,建立节点连接
start编辑:这里我设置每分钟运行
转换编辑:选择getTransfer.ktr所在的目录位置
4. 运行定时作业