Kettle Spoon入门学习
什么是Kettle Spoon
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。其中,Spoon是Kettle中的一个组件,其他组件有PAN,CHEF,Encr和KITCHEN等。
Spoon通过图形化的页面,方便直观的让你完成数据转换的操作。
所以使用Kettle需要先安装jdk
从官网进行下载压缩包,直接解压就可使用。
运行Spoon.bat,就可以看到Spoon的页面了。
实例
需求:连接oracle 实现表数据的全量抽取
一我们需要先创建一个新的转换
我们可以双击主对象树下的转换或点击文件下的新建再点转换来进行创建
二我们将核心对象下的输入点开,找到表输入拖到主页面
三双击主页面的表输入来进行设置输入数据
显示如下:
点击测试如果是显示
则表示可以成功连接点击确认即可。
如果是显示如下错误:
这是错误是t通常是数据库名称
填写错误,进行确认数据库名称进行调整即可。
还有一个通常比较常见的错误就是:
这个错是表示找不到oracle 的驱动jar 包!
这是不太方便的地方,Spoon支持的数据库类型特别多,如果把所有的数据库驱动都提前下载好,又有点多余了。
如果忘记这个步骤,在建立数据库连接时,会报错。
所以通常我们在进行操作前,别忘记将数据库驱动包放入Spoon的lib文件夹下。(使用那个数据库的就放那个就行)
确认数据库可以正常我们便可以继续进行操作了!
在SQL 框里进行填写查询输入数据的sql 语句。
为确保正确可以点下面的预览来预览数据(可手动设置预览数据的预览条数)。
确认无误后点击确认
现在输入源有了,我们要将数据输出到我们想放的位置。
我们需要在要输出的表新建一个和输入表表结构一致的表。
然后进行:
最后保存然后运行
表示运行成功,数据成功从A库A表抽取到了B库B表
实例二
需求:将两段提数结果输出到excel 发送邮件给业务
转换一:以表输入的数据流作为变量,字段名即为变量名
转换二:将数据输出到excel 多个分多个seet 页
转换三:发送邮箱
最后组合为作业:运行
注意: