kettle工具原理

Kettle是一款开源ETL工具,包括Spoon、PAN、Chef和Kitchen四个核心组件。Transformation用于数据转换,由Step构成,Job则负责组织Transformation完成任务。Hop在Transformation中表示Step间数据流动,而在Job中表示Job Entry的执行路径。数据流动基于行集缓存,保证并发和内存效率。
摘要由CSDN通过智能技术生成

kettle基础介绍

kettle,ETL工具的一种,现在kettle改名了,叫Pentaho Data Integration(PDI),但更多时候大家还是习惯用之前的名字kettle。

Kettle是一款国外开源的ETL工具,纯java编写(依赖jdk),可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。

Kettle中有两种脚本文件,transformation(.ktr)job(.kjb)

  • transformation:完成针对数据的基础转换
  • job:则完成整个工作流的控制。

kettle的四个核心组件

  • SPOON(勺子): 允许你通过图形界面来设计ETL转换过程(Transformation)。 (GUI方式)
  • PAN(平底锅):允许你批量运行由Spoon设计的ETL转换 (transform执行器)。(命令行方式)
  • CHE
  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值