(一)转换和作业
kettle的Spoon设计器用来设计转换(Transformation)和作业(Job)。
(1)转换
转换主要是针对数据的各种处理,一个转换里可以包含多个步骤(Step)。
(2)作业
作业是比转换更高一级的处理流程,一个作业里包括多个作业项(Job Entry),一个作业项代表了一 项工作,转换也是一个作业项。
(二)保存作业
用户通过Spoon创建的转换、作业、数据库连接等可以保存在资源库和XML文件中。
(1)转换文件以ktr为扩展名,作业文件以kjb为扩展名。
(2)资源库可以是各种常见的数据库。可以在Spoon中自动创建资源库,资源库默认用户名和密码是admin/admin。
(三)输入步骤
输入步骤用来从外部获取数据,可以获取的数据源包括,文本文件(txt,csv,xml,json),数据库,Excel文件等桌面文件,自定义的数据等。对特殊数据源和应用需求可以自定义输入插件。
以Excel文件“联系方式”输入为例
1、准备要输入Excel文件。Excel文件中第一行必须为标题,数据紧跟在标题后面。