ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL 是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。
一 ETL工具
【国外】
1. datastage
点评:最专业的ETL工具,价格不菲,使用难度一般
2. informatica
点评:专业程度如Datastage旗鼓相当,价格似乎比Datastage便宜。
3. kettle
点评:业界最有名的开源ETL工具。开源当然就免费,免费的有些东西使用就不是很方便。
4. ODI
点评:oracle数据库厂商提供的工具,有局限性,与oracle数据库耦合太深。
5.Cognos
6.sqoop
这个是一同事推荐的工具,具体还不了解。开源是肯定的:)
【国内】
7. beeload
点评: 最好的国产ETL工具,但产品化程度还有一定距离。
二 专业调度工具
有人说: ETL是BI的基础,而调度是ETL的灵魂,可见