术语定义:
Transformation-----转换
Step----------------步骤
Hops----------------跳接线
一个步骤是KETTLE中的最小执行单元,用于实现指定的单一逻辑任务。
一个转换是一批步骤组成的网状结构,用于实现一个相对完整的任务,转换,实际上定义了数据的流向。先看一个例子:
上图是一个转换,它从文本文件中读取数据,然后对其进行过滤,排序,最后将结果数据加载到一个关系型数据库中的一张表中。在数据过滤的过程中,当遇到错误时,数据会流向空操作。
转换,本质上是一张定向图,它描绘了数据转换逻辑的一个集合。在kettle中,转换文件的后缀是.ktr。
与转换相关的两个核心组件是步骤和跳接线:
步骤:是转换的一个构建块,比如文本文件输入输出步骤。在KETTLE中,大约有140个步骤,并基于功能进行分组,