展开全部
拉链表是在数据仓库中常见的表,主要用还存储不按时间变化的表,比如32313133353236313431303231363533e58685e5aeb931333363396333客户基本信息表。
下面先建两个实例表,user_info和user_info_l,其中user_info_l为拉链表。
user_info表及数据:
user_info_l表及转换后的数据:
kettle的设计其实很简单,就一个“表输入”一个“维度查询/更新
下面来看一下表输入的配置:
这个很简单,但是一定要有个基本表的数据日期
下面几个是“维度查询/更新”的配置:
下面介绍一下设置中的关键地方,依次如下:
1.不钩选的话变化的数据不会插入,至于不勾选时的用途,大家可以研究一下。
2.这里是创建每个版本关键字,基本就是源表的主键。
3.这里是要更新的字段,除了源表关键字