因为新公司的原因,要用到这个软件,那么我们就来看一看它到底是干啥的。
简单介绍
kettle是一款用纯JAVA编写的开源的ETL工具,所以要想运行它电脑一定要有java环境(可以在命令行中输入java -version
查看当前电脑java的版本),
下载地址 (支持全平台,用起来也是比较方便),直接解压就能用,亲测不翻墙的话时快时慢,所以建议大家在下载的时候尽量翻墙
何为ETL?
抽取(Extract):一般抽取过程需要连接到不同的数据源,以便为随后的步骤提供数据。这一部分看上去简单而琐碎,实际上它是 ETL 解决方案的成功实施的一个主要障碍。
转换(Transform):任何对数据的处理过程都是转换。这些处理过程通常包括(但不限于)下面一些操作:
- 移动数据
- 根据规则验证数据
- 数据内容和数据结构的修改
- 将多个数据源的数据集成
- 根据处理后的数据计算派生值和聚集值
加载(Load):将数据加载到目标系统的所有操作。