Informatica PowerCenter 介绍

InformaticaPowerCenter是一个ETL工具

ETL (Extract Transform Load,抽取转换装载)

负责完成数据源数据向数据仓库导入的过程。是实施数据仓库项目中最重要的步骤。如果说数据仓库项目主题话模型是一座大厦的设计蓝图,数据是建造这个大厦的砖石的话,那么ETL 就相当于建设整个大厦的过程。在数据仓库项目中,系统设计中最难的部分是用户需求分析和模型设计,而工作量最大的就是ETL 规则的设计和实施了,要占整个工作量的 60%-80%。

InformaticaPowercenter的概念

InformaticaPowerCenterInformatica公司开发的世界级的企业数据集成平台,也是业界领先的ETL工具。InformaticaPowerCente r使用户能够方便地从异构的已有系统和数据源中抽取数据,用来建立、部署、管理企业的数据仓库,从而帮助企业做出快速、正确的决策。此产品为满足企业级要求而设计,可以提供企业部门的数据和电子商务数据源之间的集成,如XML,网站日志,关系型数据,主机和遗留系统等数据源。此平台性能可以满足企业分析最严格的要求。

Informatica公司简介 

Informatica公司创立于1993年,总部位于Palo Alto, California of USA,作为电子商务分析型软件市场的领先者,一直致力于通过自身的产品和服务提升企业的竞争性优势。其拳头产品InformaticaPowerCenter已被全球多家著名企业用来建设BI/DW系统,它可集成和分析企业的关键商务信息,优化整个商务价值链的表现和响应速度。Informatica公司于1999年四月上市。
Informatica公司作为业界领先的BI/DW系统方案提供商,拥有包括分析型应用软件、广泛的支持服务和强大的数据集成平台在内的综合性产品家族。其产品系列有:InformaticaPowerCenter(企业级数据集成平台)、InformaticaPowerCenterRT(实时数据集成平台)InformaticaPoweMart(部门级数据集成平台)InformaticaPowerChannel(远程数据集成平台)、Informatica Metadata Exchange(元数据交换平台)等。Informatica的基础设施产品以可伸缩的、可扩展的企业级数据集成平台为特点,并广泛支持来自Informatica和其他的领先商务智能提供商的数据仓库基础设施和分析型应用软件的开发和管理。


世界级标准企业数据集成平台

InformaticaPowerCenter是建立可伸缩和可扩展的Informatica数据集成平台的核心和基础。InformaticaPowerCenter可以提供对广泛的应用和数据源的支持,包括对ERP系统的支持(Oracle, PeopleSoft, SAP),对CRM系统的支持(Siebel),对电子商务数据的支持(XML, MQ Series),遗留系统,及主机数据。InformaticaPowerCenter是最突出的分析性数据集成平台。 
InformaticaPowerCenter是一个可以使大的企业或组织能够按其复杂的业务信息需求,读取、转换、集成遗留系统、关系型ERPCRM,消息信息和电子商务数据的数据集成平台。


目前INFA典型企业应用



Informatica产品平台
贯穿整个数据生命周期的完整方法论


PowerCenter8.6基于SOA的体系架构




Domain 是 PowerCenter 的基本管理组件,支持 PowerCenter 的分布式服务管理,它是由若干个 Node 和 Service 组成的。其功能由 The PowerCenter Administration Console来具体完成。

一个 Node 是一台物理机器在 Domain 中的逻辑表示, Node 可以被设置为 Gateway Node 和 Worker Node,一个 Domain 中可以有多个 Node被设置为 Gateway Node,但任一运行时刻,只有一个 Gateway Node 起到 Gateway 作用,该 Node 即为 Master Gateway Node,它也是该 Domain 唯一入口,各个 Node 完成的工作见体系架构描述。

Service 包括 Service Manager 和 Application Services。
Service Manager 完成 Domain 在对应 Node 上的操作,并且是 Application Services 的容器。它运行在 Informatica Services 里面。随着 Informatica Services 的启动而启动、关闭而关闭。:一个 Node 对应一个 Informatica Services,一个 Informatica Services 对应一个 Service Manager。

Application Services 包括 Repository Services 和 Integration Services等,是 PowerCenter 完成具体任务的组件。

进程

  ServiceManager ……/server/tomcat/bin

  IntegrationService Process …… pmserver

  RepositoryService Process …… pmrepagent

  DTMProcess …… DTM


PowerCenter 数据的整合转换引擎是基于元数据驱动的,所有的元数据都存在 Repository(知识库),该知识库可以创建在所有的主流数据库中,充分体现了它的元数据的开放性。

Repository Services用来管理所有客户端以及 Informatica Server 跟Repository 的交互,并且一个 RepositoryServices 对应一个 Repository,而 Repository Services 可以为 Repository  分配 Repository Agent 来处理所对元数据操作的响应。

Integration Service  是实际处理 ETL 任务的后台服务,它是基于内存运行、高效的 ETL 服务,不需要产生任何的代码,每次执行任务之前都会从Repository 中读取最新的 ETL 规则。

Designer:设计开发环境,定义源及目标数据结构;设计转换规则,生成ETL映射。
Workflow Manager:对Workflow,Session等ETL任务作设计,同时提供了对任务执行的调度和管理功能。
Workflow Monitor:监控Workflow和Session运行情况,生成日志和报告。
Repository Manager:元数据维护和安全操作,如:元数据查找,用户、组、权限管理等。
Administrator Console:对知识库的操作,如:知识库的创建、备份、恢复等。

  • 5
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值