Kettle操作手册(当前使用版本为:Pentaho Data Integration version 7.1.0.0-12)
1.kettle安装
1.1 下载压缩包(data-integration.zip)。直接解压到本地;
1.2 配置环境变量。此版本要求本地jdk环境为1.8及以上。需要在环境变量中指定KETTLE_HOME=文件解压之后的路径。如:我本地解压在D:/soft下,则配置:KETTLE_HOME=D:/soft/data-integration。
2.kettle使用
2.1kettle 循环的 使用
当时使用的场景是:运维人员可以选择是全量重新抽取还是选取日期时间段之内的数据按照日期一天一天的进行重新抽取,前面的转换会将选取的所有时间(以日期为单位:YMD)放入列表中。循环时,以日期列表的大小为循环的大小,在循环的过程中对抽取的日期进行赋值。
kettle中循环的实现需要使用到:JavaScript、检验字段的值、循环中的业务处理转换。如下图所示:
循环初始