Kettle 作业步骤循环执行的实现

场景:User_Tables存放着系统用户的表信息,其中列Table_Name存放着表名。现在想从User_Tables中获取要进行相同数据抽取操作的表,使用Kettle实现循环执行这些表。例如统计表A、B的总行数:

SELECT COUNT(1) FROM A;
SELECT COUNT(1) FROM B;
这些SQL语句除开表名外,其他部分都是一样的,所以在使用KETTLE抽取数据时,Kettle循环抽取这些表的数据。

环境:Kettle4.4

思路:

1、上面的SQL中除了表名不一致外,其他都是一样的。所以首先解决Kettle 表输入中表名替换问题。Kettle提供了设置变量的步骤,可以将查询出的表名作为变量,在Kettle内进行传递赋值。如下图所示:

2、由于Kettle变量一次只能接收一个值,因此若是要执行查询操作的表为两个或者两个以上,就无法直接使用变量来替换${TABLEnAME}。需要一个能够存储多个表名的步骤或脚本实现遍历查询出的表名,并将查询出来的一个表名设置成变量。

                                                   

                         图1                                                                                                                                            图2

图1:将要执行表名从数据库表中取出来,并复制到trans脚本运行结果中。

图2:【获取表的数量】执行的是图1的Trans脚本,【执行表数量判断和设置变量】步骤获取【获取表的数量】步骤运行的结果,并设置控制循环和表名变量。如下图:


3、循环控制实现,其中步骤【循环控制器】相当于for(int i=0;i<size;i++)循环中i<size;【获取表行数】相当于for循环内部的处理操作;【计数器累加】相当于i++。如下图:

上图中【计数器累加】也实现变量TABLENAME复制操作。


4、整个实现的脚步如下:



上述演示脚本下载:点击打开链接




  • 5
    点赞
  • 37
    收藏
    觉得还不错? 一键收藏
  • 13
    评论
Kettle作业(Job)是一种串行的调度工具,用于控制整个工作流的执行。下面是Kettle作业设计的步骤: 1. 打开Spoon客户端,创建一个新的作业(Job)。 2. 在左侧的“任务”栏中选择需要执行的转换(Transformation)或其他作业(Job)。 3. 将所选任务拖动到作业设计区域中。 4. 右键单击任务,选择“编辑”以配置任务的详细信息,例如输入输出文件路径、数据库连接等。 5. 在任务之间添加连接,以定义它们之间的依赖关系和执行顺序。 6. 配置作业的调度选项,例如定时执行循环执行等。 7. 保存作业并运行。 下面是一个简单的Kettle作业设计示例,该作业包含两个转换任务,第一个任务将数据从CSV文件中读取并插入到MySQL数据库中,第二个任务将MySQL数据库中的数据导出到CSV文件中: ```kettle <?xml version="1.0" encoding="UTF-8"?> <job> <name>CSV to MySQL to CSV</name> <description>Import data from CSV file to MySQL database and export data from MySQL database to CSV file.</description> <entry> <name>CSV to MySQL</name> <description>Import data from CSV file to MySQL database.</description> <type>TRANS</type> <filename>/path/to/csv_to_mysql.ktr</filename> <arguments> <argument>-param:input_file=/path/to/input.csv</argument> <argument>-param:db_host=localhost</argument> <argument>-param:db_port=3306</argument> <argument>-param:db_name=mydb</argument> <argument>-param:db_user=root</argument> <argument>-param:db_pass=123456</argument> </arguments> <parallel>N</parallel> <draw>Y</draw> <hops> <hop> <from>CSV to MySQL</from> <to>MySQL to CSV</to> <enabled>Y</enabled> </hop> </hops> </entry> <entry> <name>MySQL to CSV</name> <description>Export data from MySQL database to CSV file.</description> <type>TRANS</type> <filename>/path/to/mysql_to_csv.ktr</filename> <arguments> <argument>-param:output_file=/path/to/output.csv</argument> <argument>-param:db_host=localhost</argument> <argument>-param:db_port=3306</argument> <argument>-param:db_name=mydb</argument> <argument>-param:db_user=root</argument> <argument>-param:db_pass=123456</argument> </arguments> <parallel>N</parallel> <draw>N</draw> </entry> </job> ```
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值