1:列转行
2:列转行
3:去除重复记录
步骤名称:保持唯一性
增加计数器到输出?:当勾选了此项,并在计数器字段后给予了名称,则将会在该字段下显示去掉的重复行数。
字段名称:用来去重的字段,可选多个字段,表示多个字段都相同时表示重复。
该功能类似与sql中的distinct关键字。
4:增加序列
一个序列是在某个起始值和增量的基础之上,经常改变的整数值。可以使用数据库定义好的序列,也可以使用kettle决定的序列。
kettle序列在同一个转换中是唯一使用的,每一次转换运行的时候,序列的值又会重新循环一次,从开始值开始。
使用数据库序列:
连接名称:选择数据库存在的连接名称。
序列名称:数据库序列的名称。
使用计数器来计算序列:如果想用kettle生成的序列,使用此项。
计数器名称(可选):如果一个转换中多个步骤生成同样的值名称,这个选项允许你指定计数器名称,避免按照先后顺序通过多个步骤。
起始值:序列的起始值。
增量:序列的步长。
最大值:序列的最大值。
5:字段选择
字段选择中包含有三个页签:选择和修改,移除,元数据
选择和修改:用于获取字段名称,并可以对名称进行修改,还可以修改其长度和精度。
移除:移除字段后该字段将不会被预览查看到。