Kettle笔记之:数据传输(Passing data between transformations)
一、基础介绍
kettle中使用转换(transformation)完成所有对数据的ETL工作。其中转换由多个步骤(step)组成,多个转换连接在一起可以组成一个作业(job),而作业是由一个个作业项组成,作业项可以是一个作业,也可以是一个转换。各个步骤之间以及各个作业项之间带箭头的连线我们称之为跳(hop),步骤之间的跳是数据流(指出数据传输,这与步骤的执行顺序无关,因为转换中各个步骤是并行的),而作业项之间的跳是控制流(控制各个作业项的执行,作业中各个作业项是串行的)。
二、问题及解决方法
组成转换的步骤之间可以用跳传输数据,那组成作业的多个转换之间如何传输数据呢?
对于只有一条记录的少量数据
在转换中使用设置变量(Set Variable)步骤将需要的数据存储到变量中去,然后在下一个转换中使用