kettle介绍

抽取(Extract): 一般抽取过程需要连接到不同的数据源,以便为随后的步
骤提供数据。这一部分看上去简单而琐碎,实际上它是 ETL 解决方案的成
功实施的一个主要障碍。
转换(Transform): 任何对数据的处理过程都是转换。这些处理过程通常包
括(但不限于)下面一些操作:
移动数据
根据规则验证数据
数据内容和数据结构的修改
将多个数据源的数据集成
根据处理后的数据计算派生值和聚集值
加载(Load): 将数据加载到目标系统的所有操作。

学习资料
1.http://kettle.pentaho.com/ http://wiki.pentaho.com/
2.http://infocenter.pentaho.com
3.<<Kettle Cook Book>>
4.<<Pentaho 3.2 Data Integration Beginner’s Guide>>
5.<<Kettle Solution>>
6.Kettle 代码
本课程使用的 Kettle 版本:
1.Kettle 4.4 下载地址: http://kettle.pentaho.com/
https://sourceforge.net/projects/pentaho/files/Data%20Integration/4.4.0-stable/pdi-
ce-4.4.0-stable.zip/download

2.傲飞数据整合平台 1.0.4,下载地址:
http://www.pentahochina.com


源代码下载地址:
svn://source.pentaho.org/svnkettleroot/Kettle/trunk
官方文档: http://infocenter.pentaho.com
Bug报告地址: http://jira.pentaho.com/browse/PDI
官方论坛:
http://forums.pentaho.org/forumdisplay.php?f=135
中文论坛: http://www.pentahochina.com
当前版本: Version 4.4 (2013年)
原作者: Matt
License: 4.3 以前 LGPL , 4.3 以后改为Apache 2

Kettle 的几个子程序的功能和启动方式
Spoon.bat: 图形界面方式启动作业和转换设计器。
Pan.bat: 命令行方式执行转换。
Kitchen.bat: 命令行方式执行作业。
Carte.bat: 启动web服务,用于 Kettle 的远程运行或
集群运行。
Encr.bat: 密码加密

转换和作业
Kettle 的 Spoon 设计器用来设计转换( Transformation)
和 作业( Job)。
•转换主要是针对数据的各种处理,一个转换里可以包
含多个步骤( Step) 。
•作业是比转换更高一级的处理流程,一个作业里包括
多个作业项( Job Entry),一个作业项代表了一项工
作,转换也是一个作业项。

转换文件以 ktr 为扩展名,作业文件以 kjb 为扩展名
•资源库可以是各种常见的数据库。可以在 Spoon 中
自动创建资源库, 资源库默认用户名和密码是
admin/admin。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值