文章目录
1 概述
- Kettle Spoon:开源 ETL 工具,图形化界面,操作简单直观
- 纯 Java 编写,需要先安装 JRE 虚拟机后才能运行(通常安装 JDK)
- Kettle 中文名:水壶,该软件希望把各种数据放入一个壶里,然后以一种格式流出
- Kettle 有两种脚本文件
- transformation:完成数据的基础转换
- job:完成整个工作流的控制
2 安装
2.1 软件下载
2.2 JDK 环境变量配置
2.3 数据库驱动包下载
- 将所需
数据库驱动包
放入 Spoon 的lib
文件夹下- 如:Oracle 的 ojdbc.jar
- 若缺失该步骤,则提示
错误连接数据库:驱动包缺失
2.4 双击 Spoon.bat 启动
- 打开 kettle
- 解压下载下来的压缩包,如:pdi-ce-6.1.0.1-196.zip
- 双击打开 Spoon.bat,如下所示(可能有些慢,请等待一会儿)
3 简单使用
3.1 transformation 转换
3.1.1 文件 - 新建 - 转换
- 文件 -> 新建 -> 转换 -> 主对象树 -> DB 连接
- 注意:若报某个数据库连接找不到的错误,请下载对应的数据库驱动包放入 lib 目录
配置 DB 的连接信息:
3.1.2 核心对象 - 输入 - 表输入
验证:DB 连接是否成功:
预览成功时截图:
3.1.3 核对对象 - 输出 - 插入/更新
双击 “插入/更新”,按需编辑
create table scott.emp_bak
as
select * from scott.emp where 1 = 2;
3.1.4 保存 - xxx.ktr
- 保存后,表示数据转换工作已完成
3.2 job 作业
3.2.1 文件 - 新建 - 作业
双击 “Start” 编辑 作业定时调度信息
双击 “转换”,选择上述保存好的 ktr 文件