在数据仓库环节ETL定时任务是一个必不可少的一个环节,因为定时任务取决与你的ETL程序抽取业务数据的频率程度(日、周、季、月、年),一般情况下都采用T+1方式来抽取数据。
关于Kettle定时任务需要调用脚本来执行“作业”与“转换”对应脚本名“Kitchen”与“Pan”,如果是NT系统则找.bat结尾,Linux系统则找.sh结尾相应脚本。
需求说明:默认情况下采用T+1方式抽取数据到目标表,也可以通过指定日期参数抽取数据到目标表。
1、Pan参数详解
在命令行中直接运行Pan结果如下:
参数名称
参数值描述
/rep
资源库名称
/user
资源库用户名
/pass
资源库密码
/trans
要启动的转换名称
/dir
目录(不要忘了前缀/)
/file
要启动的文件名(转换所在的XML文件)
/level
日志等级(基本,详细,调试,行级,错误,没有)
/logfile
要写入的日志文件
/listdir
列出资源库里的目录
/listtrans
列出指定目录下的转换
/listrep
列出可用资源库
/exprep
将资源库里的所有对象导出到XML文件中
/norep
不要将日志写到资源库中
/safemode
安全模式下运行
/version
显示版本,校订和构建日期
/param
设置参数名称与参数值&