Kettle 作业步骤循环执行的实现

Kettle实现Transformation 循环及跳出

 

在ETL操作中,经常需要对某个操作进行循环调用,可是使用Kettle工具时,并没有循环的组件可以调用,但在Job中引用Transformation时,可通过设置Transformation 的高级属性(”执行每一个输入行”)来实现Transformation 的循环,而在Transformation执行过程中,可根据条件设置跳出循环,或者略过本次操作,进入下一次循环。

 

循环配置步骤如下:

说明:

本例中将涉及两个Transformation 和一个Job。

Get FileNames【Transformation 】:通过此Transformation 获取固定目录下(D:\test)的sql文件全路径名称

Output FileNames【Transformation 】:通过此Transformation 将上一步骤获得的每个sql文件名写入files_output.txt文本。

Output FileNames_Loop【Job】:此Job调用Get FileNames和Output FileNames,实现Output FileNames的循环调用。

 

  1. 先设置循环的For loop点。

    Get FileNames的配置如下图,注意通配符设置:

     

     

  2. 设置循环的操作主体

    先引用上一步的结果记录,引用的是filename这个全路径文件名

     

     

    对于Modified Java Script Value这个步骤,设置的是当文件名大于”D:\test\dm.sql“时,是跳出循环,还是略过本次,进入下一次循环。

    Modified Java Script Value配置的脚本如下:

trans_Status = CONTINUE_TRANSFORMATION;

//调试

//Alert(filename.getString());

//注意“\”需要加转义符“\”

if(filename.getString().compareTo(“D:\\test\\dm.sql”)>0) {

//条件满足时,跳出循环

    trans_Status = ERROR_TRANSFORMATION;

}

 

如果要设置为满足条件时,略过本次而进入下一次循环,可修改红色字体部分为SKIP_TRANSFORMATION

 

文件输出的配置如下:


 

 

  1. 两个Transformation 完成后,新建一个Job:Output FileNames_Loop:

     

    注意Output FileNames【Transformation 】的高级属性中,勾上”执行每一个输入行”。

     

    保存后,执行进行调试即可。

 

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/10009036/viewspace-1063937/,如需转载,请注明出处,否则将追究法律责任。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Kettle作业(Job)是一种串行的调度工具,用于控制整个工作流的执行。下面是Kettle作业设计的步骤: 1. 打开Spoon客户端,创建一个新的作业(Job)。 2. 在左侧的“任务”栏中选择需要执行的转换(Transformation)或其他作业(Job)。 3. 将所选任务拖动到作业设计区域中。 4. 右键单击任务,选择“编辑”以配置任务的详细信息,例如输入输出文件路径、数据库连接等。 5. 在任务之间添加连接,以定义它们之间的依赖关系和执行顺序。 6. 配置作业的调度选项,例如定时执行循环执行等。 7. 保存作业并运行。 下面是一个简单的Kettle作业设计示例,该作业包含两个转换任务,第一个任务将数据从CSV文件中读取并插入到MySQL数据库中,第二个任务将MySQL数据库中的数据导出到CSV文件中: ```kettle <?xml version="1.0" encoding="UTF-8"?> <job> <name>CSV to MySQL to CSV</name> <description>Import data from CSV file to MySQL database and export data from MySQL database to CSV file.</description> <entry> <name>CSV to MySQL</name> <description>Import data from CSV file to MySQL database.</description> <type>TRANS</type> <filename>/path/to/csv_to_mysql.ktr</filename> <arguments> <argument>-param:input_file=/path/to/input.csv</argument> <argument>-param:db_host=localhost</argument> <argument>-param:db_port=3306</argument> <argument>-param:db_name=mydb</argument> <argument>-param:db_user=root</argument> <argument>-param:db_pass=123456</argument> </arguments> <parallel>N</parallel> <draw>Y</draw> <hops> <hop> <from>CSV to MySQL</from> <to>MySQL to CSV</to> <enabled>Y</enabled> </hop> </hops> </entry> <entry> <name>MySQL to CSV</name> <description>Export data from MySQL database to CSV file.</description> <type>TRANS</type> <filename>/path/to/mysql_to_csv.ktr</filename> <arguments> <argument>-param:output_file=/path/to/output.csv</argument> <argument>-param:db_host=localhost</argument> <argument>-param:db_port=3306</argument> <argument>-param:db_name=mydb</argument> <argument>-param:db_user=root</argument> <argument>-param:db_pass=123456</argument> </arguments> <parallel>N</parallel> <draw>N</draw> </entry> </job> ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值