一个数据抽取过程中主要包括创建一个作业,并且每个作业可以包括多个转换操作。
1.转换
一个转换包括一个或多个步骤。
转换是以并行方式执行的
转化中的步骤是通过跳连接的,跳定义了一个单向通道,允许一个数据从一个步骤向另一个步骤流动。跳是步骤之间带箭头的连接线,即数据通道,用于连接两个步骤,实现将两个元数据从一个步骤传递到另一个步骤,支持分发和复制。
数据单位是行,数据流就是数据行从一个步骤到另一个步骤移动。
下面是一个转换的例子:
2. 作业
一个作业包含一个或者多个作业项,并且这些作业项都是以某种顺序进行执行的。
作业是以串行方式执行的。
作业项:作业项是作业的基本构成部分,也可以称为控件。
作业项与步骤的区别:
.步骤的名字是唯一的,而作业项可以进行复制。
.