一、Kettle是什么?
1、 是一款开源的、绿色的、解压即用的工具
2、 设计初衷是像一个水壶(Kettle)一样,接入不同来源的数据,做统一格式的输出
3、 主要用来做ETL的工具,是一个完全图形化界面的好友工具
4、 主要有两种脚本文件,一个是Transformation(.ktr)和job(.kjb),一个是针对数据的转换,一个是工作流程的控制。
二、Kettle架构:
1.Spoon:图像化界面工具(gui方式),允许通过图形界面来设计Job和Transformation,可以保存在文件中或者数据库中
2. Pan:Transformation的执行器,用于在终端执行Transformation,没有图形化界面
3. Kitchen:Job执行器,用于在这终端执行Transformtion,没有图形化界面
4. Carte:嵌入式Web服务,用于远程执行Transformation和Job,并通过Carte建立集群
5. Encr:用于对字符串进行加密的命令行工具,比如在Job和Transformation链接数据库时的参数进行加密。
三、Kettle使用注意事项
1、Kettle在连接mysql时注意要将jdbc的jar包添加到对应的目录
2、Kettle在连接其他的数据源时,比如hive和hbase时,注意不但需要对应的配置文件,而且需要版本对应,Kettle默认的版本和我们安装使用的版本不一定一致,如果不一致使用时会报错。