提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
前言
认识ETL并知道如何安装ETL
一、ETL是什么?
- ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程。
- 目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。
- ETL是BI(商业智能)项目重要的一个环节。
二、安装步骤
1.安装jdk以及配置环境变量
建议安装 JDK1.8 及以上,7.0以后版本的 kettle 不支持低版本 JDK!
下载地址:链接: JDK安装地址
安装后 添加环境变量 (自行百度教程)
2.安装kettle
下载地址:链接: kettle安装地址
3.mysql驱动包
下载地址(有驱动包就不用下载了):链接: mysql驱动包安装地址
下载好后将文件解压,将里面的 mysql-connector-j-8.2.0.jar 放到,kettle解压的lib下面( \data-integration\lib)
4.启动kettle
\data-integration目录下双击Spoon.bat,启动kettle。
至此安装完毕!
总结
以上就是今天要讲的内容,本文仅仅简单介绍了ETL的安装步骤,而后续还需要学习ETL中数据之间转换,清洗,提取。