kettle从入门到精通 第六十六课 ETL之kettle kettle阻塞教程,轻松获取最后一行数据,so easy

场景:ETL沟通交流群内有小伙伴反馈,如何在同步一批数据完成之后记录下同步结果呢?或者是调用后续步骤、存储过程、三方接口等。

解决:使用步骤Blocking step进行阻塞处理即可。

1、下面的demo演示从表t1同步数据至表t2(t1表中有三条数据,t2为空表,两个表表结构相同),然后数据同步完毕之后进行其他操作,这里的只是打个日志记录下最后一行数据,如下图所示:

1)从图片日志可以很清晰的看到,当前数据打印了三次,表输入和表输出也都执行了3次。

2)从图片日志可以很清晰的看到,Blocking step 读取了三条数据,只写了一条数据。

3)从图片日志可以很清晰的看到,Blocking step 后面的日志步骤只打印了最后一行数据。

 2、Blocking step配置,双击步骤打开配置项。

 Pass all rows?:若不勾选,表输出步骤成功写入3条数据之后只有最后一条数据才会通过Blocking step步骤传递给之后的步骤。如下图所示:

 3、Pass all rows?:若勾选,表输出步骤成功写入3条数据之后所有数据都会通过Blocking step步骤传递给之后的步骤。如下图所示:

1)从图片日志可以很清晰的看到,Blocking step 读取了三条数据,写了三条数据。

2)从图片日志可以很清晰的看到,虽然Blocking step 写了三条数据,但是执行顺序依然是在Blocking step的前置步骤表输出完毕之后。

 4、缓存大小配置,行数设置的越大,该步骤执行的效率也就越高,否则会频繁操作临时文件。

 上图步骤中将缓存大小设置为1,从日志来看Blocking step步骤就打印了“打开临时文件”,很显然缓存大小设置的行数太小会降低性能。这里使用的时候根据自己的机器实际内存情况来定。

  • 9
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Kettle(Pentaho Data Integration)是一款开源的 ETL 工具,可以用于数据抽取、转换和加载。下面是 Kettle 从入门到精通的一些步骤: 1. 下载并安装 Kettle 可以从官方网站下载 Kettle,然后按照提示安装即可。 2. 创建一个新的转换(Transformation) 在 Kettle 中,转换是指将原始数据转换为目标数据的一系列操作。要创建一个新的转换,可以在菜单栏中选择“文件”→“新建”→“转换”。 3. 添加输入源(Input) 在转换中,需要指定输入源,可以从各种数据源(如文件、数据库、Web 服务等)中读取数据。在 Kettle 中,可以通过“输入”组件来定义输入源。选择“输入”组件,然后在“设置”选项卡中输入相应的信息。 4. 添加转换步骤(Step) 在转换中,可以添加多个步骤来对数据进行转换、清洗、过滤等操作。在 Kettle 中,可以通过拖拽组件来添加转换步骤。例如,可以添加“文本文件输出”步骤来输出转换后的数据。 5. 运行转换 完成转换设置后,可以点击工具栏上的“运行”按钮来运行转换。Kettle 会根据设置的步骤依次执行,直至转换完成。 6. 高级应用 除了基本的数据转换外,Kettle 还支持更高级的功能,如作业(Job)、参数化、脚本等。通过学习和掌握这些高级功能,可以更加灵活地使用 Kettle 解决数据处理问题。 以上是 Kettle 从入门到精通的一些基础步骤,希望能对你有所帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值