1. Kettle简介
(1)Kettle是ETL工具,数据抽取高效稳定。中文名水壶,把各种数据放到一个壶里,然后以一种指定的格式流出。
(2)Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
(3)Kettle的核心组件:
Spoon:通过图形接口,用于编辑作业和转换的桌面应用。
Pan:一个独立的命令行程序,用于执行Spoon编辑的转换和作业。
Kitchen:一个独立的命令行程序,用于执行由Spoon编辑的作业。
Carte:轻量级的Web容器,用于建立专用、远程的ETL Server。
(4)核心概念
步骤(控件):比如EXCEL输入控件。
跳(Hop):步骤之间带箭头的连线称为跳,定义了步骤之间的数据通路。shirt键+拖拽。
分发:比如,a文件的数据分发到文件b和c中,意思就是a文件的第一条数据分给b,第二条数据分给c,第三条分给b…以此类推。
复制:比如,a文件的数据复制给文件b和文件c中,a数据=b数据=c数据。
元数据:对字段的描述,比如:名称、数据类型、格式、长度等。
作业中,步骤(转换)之间的连线:
蓝色+锁:无论上个步骤执行正确与否,下个步骤都会执行。
Kettle的简介和使用总结
最新推荐文章于 2024-05-07 14:26:15 发布
![](https://img-home.csdnimg.cn/images/20240711042549.png)