一.异构数据平台给企业集成带来的困扰
企业数据往往分布在不同的业务子系统中,彼此独立,形成多个信息孤岛,如果要进行数据集成,那么企业所面临的一个关键问题就是如何高效的获取数据,同时又不用花费太多的精力和成本?
可惜理想很丰满,现实很骨感,我们的数据源可能来自于不同的数据库,例如DB2,Oracle,SQLServer,Teradata,Sybase,MySQL, Netezza; 也有可能位于不同的操作系统平台,例如AIX,Linux,Windows,Mainframe。那么,三个大大的疑问将不可避免地摆在我们面前:
- 我们能在短时间内掌握如此多主流的、非主流的数据库技术吗?
- 我们有能力去实施和优化异构数据集成方案吗?
- 数据集成尚在前期就花费了如此多精力在数据抽取和数据加载上面,那么接下来的数据处理、数据整合岂不是要累趴下?
怎么办?项目还能好好的进行下去吗?BI系统,数据仓库,数据集市的建设都还指望着前期数据集成工作能早日完成呢,负责集成的攻城狮们表示压力山大。。。
问题总会有解决的办法,利用DataStage便可轻松实现对各种异构数据库的访问和读写,从而让我们能节省出更多的时间和精力去创造更大的价值。
二.DataStage提供对异构平台的全面支持
InfoSphere DataStage是IBM统一数据集成平台InfoSphere Information Server的重要组件,是业界主流的 ETL工具(Extract, Transform, Load)。
DataStage采用简单易用的图形化设计方式,内置丰富的功能模块和接口,从而支持对海量数据进行抽取、清洗、转换和加载。同时它广泛支持各种异构平台的数据源和各种类型的数据格式(结构化、半结构化和非结构化数据),具有满足最苛刻的数据集成需求所需的功能性、灵活性和可伸缩性。