《数据清洗》第三章 Kettle工具的基本使用 笔记

一、Kettle简介

Kettle是一款国内免费开源的轻量级ETL工具,是基于Java语言开发的,可以在Windows、Linux、UNIX系统上运行,并且是绿色无需安装的,可用于各种数据库之间的数据的迁移。Kettle工具主要由4个组件组成,分别是Spoon、Pan、Kitchen及Carte组件。

Kettle有7点设计原则,分别是:

1.易于开发

2.避免自定义开发

3.所有功能都能通过用户界面完成

4.没有命名限制

5.透明

6.灵活的数据通道

7.只映射需要映射的字段

二、Kettle的下载安装

1.下载Kettle安装包:下载地https://sourceforge.net/projects/pentaho/files/Data%20Integration/。

2.安装Kettle:由于Kettle工具是绿色无需安装的,因此我们只要解压下载的Kettle工具pdi-ce-8.2.0.0-342.zip即可。

3.配置Kettle:将Java和Kettle的安装路径都添加至系统环境变量;将数据库驱动添加至Kettle安装包下的lib文件夹下。

4.启动Kettle:双击Kettle安装目录下的Spoon.bat脚本,启动Kettle。

三、Kettle的基本概念

Kettle工具的执行分为两个层次,即转换作业,这两个层次的最主要区别在于数据传递执行方式。Kettle的概念模型图如下图所示。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值