Kettle中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里然后以一种指定的格式流出。Kettle主要包括四部分,分别为Chef,Spoon,Kitchen,Pan。 Kettle 提供一个图形用户界面Spoon,用来设计数据转换过程。在Spoon中,用户可以使用左面的组件树,在右面的面板中设计转换流程,并在Log View面板中查看运行结果。日后系列文章介绍图形用户界面Spoon中各组件的使用。
本文选用的kettle版本为3.2,但5.4版本之前皆可通用
1.资源库管理
登陆时可以选择”没有资源库”即可进入Kettle,此时所定义的转换和工作将只能存储在本地磁盘上,以.ktr文件和.kjb文件的方式。若使用资源库登录,则所有定义的转换和工作将会存储到资源库里。实际上,资源库就是一个数据库,比如SQL SERVER数据库,里面存储了 Kettle定义的元素的相关元数据,简单而言,就是元数据库。如果资源库创建完毕,则资源库的相关信息将存储在文件 “reposityries.xml”中,它位于你的缺省home 目录的隐藏目录“.kettle”中。如果是windows 系统,这个路径就是 c:\Documents andSettings\<username>\.kettle。
1.1新建资源库
1)新建到资源库的的数据库连接点击”新建”按钮,弹出以下对话框:
a.数据库连接是让我们选择数据库连接,这里意思为我们可以在本地数据库新建一个或多个数据库(比如 sql server 数据库)做资源库,然后连接到该资源库 b.表示资源库的名字
我们 初没有资源库,则点击