前言
随着大数据的不断发展,企业级别的数据转换显得尤为重要,从本文开始和大家一起学习一款开源ETL工具–Kettle。
一、ETL
1.ETL是啥?
看看它的全称Extract-Transform-Load,翻译过来就是:抽取-转换-加载,简单来说就是个数据处理的初加工基地,厉害与方便之处就是它可以对多种数据源进行批量的、定时的清洗、加工、转换等处理,然后按照指定的格式输出,可以输出json、excel、csv、数据库等等,画了个图,所以呢,有了ETL就不用手动转化这些数据啦
2.ETL有啥价值?
ETL通常是企业构件数据仓科的一个重要环节,可以完成数据从数据源向目标数据仓库转化,这样数据再经过处理更容易被整理为信息与知识。
(