kettle案例3.2—作业、转换管理
作业
目前,大多数的 ETL 项目都需要完成各种各样的维护工作。例如,如何传送文件、验证数据库中的数据表是否存在等操作,这些操作都必须按照一定顺序完成,由于转换是以并行方式执行的,因此需要一个可以串行执行的作业来处理这些操作。
一个作业包含一个或者多个作业项,并且这些作业项都是以某种顺序来进行执行的。
作业执行的顺序由作业项之间的跳( Job Hop )和每个作业项的执行结果来决定。
1.创建作业
简单的作业例子
1. 作业项
作业项是作业的基本构成部分,也可称之为控件。作业项类似于转换中的步骤,也可以使用图标的方式进行图形化展示。
作业项与步骤的区别
- 步骤的名字是唯一的,而作业项可以进行拷贝,也就是说可以将一个作业项放在多个不同的位置,并且这些拷贝的作业项中的信息都是相同的,若修改了其中一个作业项,那么其他拷贝的作业项也都会随之修改;