kettle简介

kettle也叫Pentaho Data Integeration,是一款开源的ETL(Extract Transformation Load)工具,用来完成数据的抽取,转换和加载工作。

Kettle 里有转换(Transformation)和 作业(Job)两个概念。

转换主要是针对数据的各种处理,一个转换里可以包含多个步骤(Step),每个步骤就是一种数据处理方式,如表输入,文件输入,排序,分组,过滤,选择列,拆分列,增加列等等增加列等等。Kettle 内置了数十种步骤,另外还可以通过插件的方式由用户自定义自己需要的步骤。转换中的处理是并发的。

作业是比转换更高一级的处理流程,一个作业里包括多个作业项(Job Entry),一个作业项代表了一项工作,常用的作业项有发送邮件,接收邮件,执行shell 脚本,FTP等等。转换也是作业项之一,即一个作业里可以包括多个转换。一个作业项也可以是其他的一个作业,即作业可以嵌套。作业项也可以通过插件的方式由用户自定义。

转换和作业的设计都是通过 spoon 来完成的,spoon 就是 kettle 的图形界面设计器。设计好的作业可以保存在文件(转换文件以 .ktr  为扩展名,作业文件以 .kjb 为扩展名)里,也可以保存在数据库(资源库)里。 

设计好的作业可以使用 kitchen 来执行,设计好的转换使用来 pan 执行。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值