目录
一、Kettle简介
Kettle 是一款开源的 ETL 工具,纯 java 编写
1、Kettle工程存储方式
(1)以 XML 形式存储
(2)以资源库方式存储 (数据库资源库 和 文件资源库)
2、Kettle的两种设计
转换 (transformation ):完成对数据的 基础转换。
作业 (job) :控制完成整个工作流。
区别:
①作业是步骤过程,转换针对数据流。这是最大的区别。
②作业的每一个步骤,需要等前面的步骤跑完了才能执行;转换会一次性启动所有的控件,一个控件对应一个线程,然后让数据流从第一个控件开始,依次流向最后一个控件。
转换:数据输入 → 处理逻辑 → 输出
作业: start → 转换 (告警邮件) → 作业项 → 作业项 → end
3、Kettle的组成
①勺子(Spoon):图形化界面,开发转换 和作业。
②煎锅(Pan):命令行 调用 Tansformation。
③厨房(Kitchen):命令行 调用 Job。
④菜单(Carte):轻量级 Web 容器,建立专用 远程的ETL Server。
4、kettle教程
二、Kettle的安装部署
1.下载地址
(1)Kettle9.4版本 Pentaho Data Integ