1.转换
转换是ETL解决方案中重要的组成部分之一,主要用于数据的抽取、转换以及加载等操作,其本质是一组图形化的数据转换配置的逻辑结构。
下面通过一个简单的例子来讲解转换。
双击Kettle目录下的Spoon.bat脚本,启动Kettle工具,在工具栏处选择“文件”-“新建”-“转换”命令,创建一个转换,默认名称为“转换1”,如图1.1所示。
在Kettle主界面的工作区右击空白处,从弹出的快捷菜单中选择“新建注释”命令,并添加注释的内容;然后单击“输入”,再双击“表输入”;单击“输出”,再双击“文本文件输出”这样就建立了“表输入”向“文本文件输出”的连接。如图1.2所示。
这个简单的转换例子是实现从数据库中读取数据,并把数据写到文本文件中。
2.作业
一个作业包含一个或者多个作业项,这些作业项都是以某种顺序进行执行的。作业执行的顺序是由作业项之间的跳和每个作业项的执行结果决定的。
下面通过一个简单的例子来讲解作业。
双击Kettle目录下的Spoon.bat脚本,启动Kettle工具,在工具栏处选择“文件”-“新建”-“作业”命令,创建一个作业,默认名称为“作业1”,如图2.1所示。
主对象树中的节点主要用于显示当前作业的运行配置参数、数据库连接以及作业项目等信息。如图2.2所示。
在Kettle主界面的工作区右击空白处,从弹出的快捷菜单中选择“新建记录”的命令,并添加注释的内容;然后单击“通用”,再双击“Start”和“作业”;单击“邮件”,再双击“发送邮件”,三者之间建立连接。如图2.3所示。
这个例子是一个典型的加载数据到数据仓库的作业。