ETL(Extrat-Transform-load),即数据抽取,转换,装载的过程。
kettle是个ETL工具集,允许你管理来自不同的数据库,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。kettle现已经更名为PDI(Pentaho Data Integration-Pentaho数据集成)
kettle结构:Spoon、Data Integration Server、Enterprise Console
Spoon是构建ETL Jobs和transformation的工具。Spoon以拖拽的方式图形化设计,能够通过spoon调用专用的数据集成引擎或者集群。
Data Integration Server是一个专用的ETL Server,主要功能有执行、安全性、内容管理、时序安排。
Enterprise Console:企业控制台,提供一个小型的客户端,用于管理Pentaho Data Integration企业版的部署。
kettle的核心组件:
kettle概念模型
kettle下载国内镜像:http://mirror.bit.edu.cn/pentaho/Pentaho%208.2/client-tools/
使用手册:
链接:https://pan.baidu.com/s/1vAh0Hv_vcfrR53FSfEzhYg
提取码:7pws