Kettle数据同步和抽取

Kettle是一款国外开源的ETL工具,纯java编写,数据抽取高效稳定。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

Kettle的简单使用

下载Kettle并解压,设置环境变量新增KETTLE_HOME,指向kettle路径


window下运行Spoon.bat,启动Kettle

首先数据库里有user_1表如下


再新建一直目标表user_2

[html]  view plain  copy
  1. create table user_2 as select * from user_1 where 1=2  
则完成了新表的创建

Kettle启动界面如下

新建一个转换,选择主对象树-新建DB连接,新建DB连接前先下载相应的oracle数据库驱动ojdbc6.jar,并放在Kettle下的lib文件夹里


创建DB连接后,选择核心对象-输入-新建一个表输入,并设置其属性

选择核心对象-输出-新建一个插入/更新,并设置其属性

目标模式为用户名
查询关键字ID用于插入时判断是新增还是更新,点击确定后并保存改新建的转换文件。

新建一个job,选择核心对象-通用-分别新建一个START和转换,并设置其属性。


转换文件名的文件指向之前保存的转换1.点击运行即可。运行结果如下


再看user_2表,可以发现user_1中的数据同步到user_2表了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值