ETL
- ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据
- ETL的设计分三部分:数据抽取、数据的清洗转换、数据的加载。
- ETL工具:Kettle spoon
Kettle spoon
1. 转换:将数据流经过一系列操作传输到目标数据源
- 转换的创建:
新建一个转换
1新建空白转换
文件—>新建—>转换 :新建一个空白的转换,ctrl+s保存该转换,命名为标准表的表名;
2添加数据库连接
在主对象树中,双击DB连接,或右击DB连接,选择新建数据库连接,打开数据库连接对话框:
其中Oracle数据库连接中的数据表空间,索引表空间两项不需要填。其余参数必填,填好之后点测试,检测是否能正确连接,连接成功后,点确认,便保存了当前连接。
其实,可以随时在需要的时候建立数据库连接,而不必刚开始就添加。
3添