1.DataStage 与 Info Sphere Information Server 的关系
为什么要讨论这两个产品呢?因为在我们安装DataStage的时候,总能看到 InfoSphere Information Server 的身影,所以我们需要了解一下它们之间的关系。
Info Sphere Information Server 是 IBM 所提供的统一数据集成和数据治理平台,通过该平台可为企业提供丰富的端到端数据整合解决方案,覆盖企业级数据生命周期管理,元数据管理,数据治理,数据集成等等诸多关键领域。
Info Sphere DataStage 是 InfoSphere Information Server 软件包中的核心组件,主要提供专业而强大的数据抽取,数据转换和数据加载功能,是业界主流的ETL工具。
2. DataStage的产品架构
如上所述,我们所谈到的DataStage产品架构实际上就是InfoSphere Information Server 的产品架构,该架构包括四层:
Client Tier:即客户端层,为 DataStage 作业的开发、维护和管理监控提供各种客户端程序。
Engine Tier: 即引擎层,为 DataStage 提供运行引擎和应用及数据连接组件等。
Services Tier: 即服务层,为 DataStage 提供管理接口和各种公共服务。
Metadata Repository Tier:即元数据存储层,为 DataStage 提供元数据存储及管理。
Client Tier(客户端层)
1. DataStage Administrator :用于管理 DataStage 工程及作业的属性和环境变量等。
2. DataStage Designer:用于开发、编译、执行及调试 DataStage 作业(Job)。
3. DataStage Director:用于批量运行并监控 DataStage 作业(Job)。
4. Web Console & Operation Console:用于权限管理、session 管理及运维平台。