ETL工具-Kettle教程(Windows)

一、kettle基本知识

1.什么是kettle

kettle是开源的、可视化、功能强大的ETL工具,基于纯java开发。可以在Windows、Linux等上运行使用。是一款相对稳定且具有可视化的数据抽取工具。
在这里插入图片描述

2.kettle具有两个脚本:transformation(转换)和job(作业)。

transformation:完成对输入目标数据的基础转换;

job:封装装换过程,完成对整个工作流的控制。

在这里插入图片描述

3.kettle有三个主要的组件:Spoon、Kitchen、Pan

Spoon:一个图形化的工具,用于设计和维护的复杂的ETL工作流。Windows选择Spoon.bat;Linux选择Spoon.sh。

Kitchen:执行job作业。

Pan:执行transformation转换。

在这里插入图片描述

二、安装与使用

1.安装

本教程的kettle是免安装的,只需要解压kettle的压缩包即可(教程最后有压缩包,有需要的自行拉取)。但是由于kettle是基于java开发的,所以要安装jdk。解压完毕之后如下图:

在这里插入图片描述

2.启动图形化工具Spoon

点击文件夹data-integration后,如下图所示:

在这里插入图片描述
在Windows系统下点击Spoon.bat即可。

3.创建Transformation(转换)

点击左上角 文件 → 新建 → 转换,即可进入转换页面。如下所示:

在这里插入图片描述

①点击输入。我们将需要进行ETL的目标数据输入进来,输入格式需要与目标数据格式一致。

②点击转换。根据业务需求,对目标数据进行增、删、改、查等一系列操作。

③点击输出。对已经清洗过的数据进行输出,输出格式可根据业务需求,也可自行选择。

在这里插入图片描述

(转换的保存,是以.ktr为结尾的文件。)

4.创建Job(作业)

点击左上角 文件 → 新建 → 作业,即可进入转换页面。如下所示:

在这里插入图片描述
job(作业)一般是用来运行一个transformation(转换)。

①在左面核心对象中,选择通用中的“开始”,拖到右面作业框中。每一个作业都需要先配置一个“开
始”,表示开始作业运行。

②在左面核心对象中,选择通用中的“转换”,拖到右面作业框中。再将我们配置好的转换上传即可。

③在左面核心对象中,选择通用中的“成功”,拖到右面作业框中。即可完成作业流程。
(作业的保存,是以.kjb为结尾的文件。)

在这里插入图片描述

三、相关学习资料

1.Kettle压缩包

链接: https://pan.baidu.com/s/1htCc4X4f37delbFU-_qIJw 提取码: shgw 复制这段内容后打开百度网盘手机App,操作更方便哦

2.JDK(1.8版本)

链接: https://pan.baidu.com/s/1mnTQt8AuhuWF3j0tOkUdIQ 提取码: nnkt 复制这段内容后打开百度网盘手机App,操作更方便哦

JDK的下载、安装及环境变量配置点这里(保姆级教程)

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值