目录
一.项目背景
因公司部分业务部门暂无填报系统,初步由Excel转为使用石墨文档与快表,对填报录入的校验功能接受度较低,进而导致数据填写不规范,数据库数据凌乱,零散,无分类等,不利于BI开发使用,故需要利用Kettle来进行数据同步、清洗等工作,建立数据仓库。
Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取高效稳定。ETL,是将数据从来源端经过抽取(extract)、交互转换(transform)、加载(load)至目的端的过程。Kettle分为transformation和job两种脚本文件,