前几年,在BI大数据项目中陆续接触到了几款数据分析工具,包括Oracle BIEE、Tableau和国内的FineBi产品。
我们看到的分析页面背后,其实包含了很多数据ETL工作。ETL是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。
其中,有一款特别优秀的专业数据ETL工具informatica PowerCenter。
接触到这个工具是用到了OBIEE。OBIEE全称Oracle Business Intelligence Enterprise Edition,官方介绍中描述OBIEE可提供完整的 BI 功能,包括交互式信息板、完全即席的主动式智能和警报、企业和财务报表、实时预测智能以及离线分析等。
部署OBIEE系统需要一定的技术门槛,后期维护也需要专业人员来负责。我用过OBIEE配套的Admin Tools工具来进行数据建模,使用其自带的前端工具来进行数据分析和展现。但是却将数据的ETL工作交给了专业工具-informatica。
Informatica是全球领先的数据管理软件提供商,创立于1993年,官方描述道:借助Informatica全面、统一、开放且经济的数据管理平台,组织可以在改进数据质量的同时,访问、发现、清洗、集成并交付数据,以提高运营效率并降低运营成本。Informatica平台是一套完善的技术,可支持多项复杂的企业级数据集成计划,包括:企业数据集成、大数据管理、数据质量、数据治理 、主数据管理、数据安全和云数据集成等。
Informatica于2005年正式进入中国,其产品线比较丰富,我们用到的是其中I