ETL工具kettle入门helloworld

kettle官方网站http://kettle.pentaho.com/
先下载压缩包,我这里下载的是4.4版本,大概400M
下载后解压,装JDK,配环境变量
配置完毕后,打开解压后根目录下有Spoon.bat,双击打开
创建资源库,用户名密码都是admin


kettle一共可以创建两种脚本文件,一种是transformation,就是任务,比如抽取数据,合并修改什么的。
另一种是job,就是用来调用transformation的,类似oracle里的job调用存储过程。
接着创建数据库连接,在此就不多说了,值得注意的是假如用的是oracle,压缩后的包里是没有oracle的jdbc驱动的,所以需要找一个ojdbc14或者classes12驱动包,放在libext/JDBC里边才可以,因为假如你要操作的是数据库连接数据库的时候用的是JDBC连接。
做完了这些工作,就可以开始了。打开之后,类似流程设计器这么个东西,对,实际上就是流程设计器

[img]http://dl.iteye.com/upload/attachment/0083/3498/576fc3d9-e5f8-3c64-8ff5-ec5dd308fb9b.jpg[/img]

这个流程就是将两个关联表的数据,合并成1个表。
前提工作:在数据库新建两个表,有主外键关系,表名testout1,testout2,建第三个表testin。
双击表输入,设置testout1,双击表输入2,设置testout2

双击记录关联 (笛卡尔输出),见下图

[img]http://dl.iteye.com/upload/attachment/0083/3500/61f547f7-5f04-385b-8a6b-14287a72a5b2.jpg[/img]
所有的关联条件都是可以设置的,设置完毕,设置字段选择,在这里可以选择需要哪几列什么的。
最后设置表输出testin就可以了。


关于job,更简单,常用控件就是start,可以设置运行周期,
transformation 设置此job运行的transformation,
最后就是success。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值