Kettle8.3之创建资源库 https://blog.csdn.net/weixin_45102492/article/details/106380842
Kettle8.3之Linux下安装使用 https://blog.csdn.net/weixin_45102492/article/details/106382356
Kettle8.3之调优 https://blog.csdn.net/weixin_45102492/article/details/106391921
Kettle8.3遇见的错误 https://blog.csdn.net/weixin_45102492/article/details/106378416
一、Kettle简介
Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。
Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。
Kettle背景知识- ETL
抽取(Extract) 一般抽取过程需要连接到不同的数据源,以便为随后的步
骤提供数据。这一部分看上去简单而琐碎,实际上它是ETL解决方案的成
功实施的一个主要障碍。
转换(Transform) 任何对数据的处理过程都是转换。这些处理过程通常包
括(但不限于)下面一些操作:
移动数据
根据规则验证数据
数据内容和数据结构的修改
将多个数据源的数据集成
根据处理后的数据计算派生值和聚集值
加载(Load) 将数据加载到目标系统的所有操作。
概念扩展: ELT,EII(Enterprise information integration )/Data federation
Kettle的两种设计
运行平台支持编辑
kettle 8.2版本可以支持windows、linux和mac os操作系统
产品家族编辑
Kettle家族目前包括4个产品:Spoon、Pan、CHEF、Kitchen。
SPOON 允许你通过图形界面来设计ETL转换过程(Transformation)。
PAN 允许你批量运行由Spoon设计的ETL转换 (例如使用一个时间调度器)。Pan是一个后台执行的程序,没有图形界面。
CHEF 允许你创建任务(Job)。 任务通过允许每个转换,任务,脚本等等,更有利于自动化更新数据仓库的复杂工作。任务通过允许每个转换,任务,脚本等等。任务将会被检查,看看是否正确地运行了。
KITCHEN 允许你批量使用由Chef设计的任务 (例如使用一个时间调度器)。KITCHEN也是一个后台运行的程序。
二、Kettle下载
下载连接https://community.hitachivantara.com/s/article/data-integration-kettle
访问网址
如下图点击可以下载想要的版本
Kettle目录文件
Kettle部署
由于Kettle是Java语言开发的,该软件的允许需要Java运行环境的依赖。
需要先安装JDK,准备好Java软件的运行环境。解压后,在windown下双击Spoon.bat,就可以启动Kettke的UI界面
…
下面是在windows下解压操作的:
kettle快速体验