一、kettle:
是最早使用的一种开源ETL的工具,是一种开源的ETL工具,底层是使用纯java实现的,可以在不同的环境中进行部署。
二、kettle工程的存储形式:
1、以xml形式存储
2、以资源库的方式进行存储(例如数据库、资源库、文件资源库)
三、kettle主要分成两张模式分别是:
转换 (transformation) :对数据的转换和控制
作业(job):完成整个工作的流程
两者最主要的区别是:
1、作业是步骤流,转换是数据流。
2、作业每一个步骤,必须需要等前面的步骤完成后才能进行,对于转换来说是一次性把所需要的控件全部执行完。在作业中是可以包含着转换。
四、kettle的组成:
1、spoon.bat/spoon.sh(linux):(勺子),主要的作用是一个图形化界面,可以使用图形化的方式开发transformattion和job
2、pan.bat/pan.sh(linux):(煎锅),利用pan来调用transformation
3、kitchen.bat/kitchen.sh(linux):(厨房):利用kitchen来调用job
4、carte.bat/carte.sh(linux):(菜单):轻量级的web服务器,主要是用来建立远程的服务器。