Informatica 结构
1个或多个资源库(Respository)
PowerCenter数据整合引擎是基于元数据驱动的,提供了基于数据驱动的元数据知识库(Repository),该元数据知识库可以在主流的关系型数据库中部署。该院数据库中存储所有的ETL元数据,包括:源、目标表的物理和逻辑元数据,ETL转换规则,知识库用户权限,ETL任务运行历史信息等元数据。
2个Server
Informatica Repository Server: 资料库的Server,管理ETL过程中产生的元数据,用来管理所有对资料库中元数据的请求和操作。
Informatica Server: 实际的ETL引擎
5个Client
PowerCenter Designer: 设计开发环境,定义源及目标数据结构;设计转换规则,生成ETL映射
Workflow Manager: 合理地实现复杂的ETL工作流,基于时间、事件的作业调度
Workflow Monitor: 监控Workflow和Session 运行情况,生成日志的报告
Repository Manager: 资料库管理,包括安全性管理等,元数据维护和安全操作,如:元数据查找,用户、组、权限管理等。
Repository Server Administrator Console:对知识库的操作,如:知识库的创建、备份,恢复等。
ETL的实现方法
●安装Oracle服务器
●在数据库下新建用户,用来管理资料库,用于存放源表和目标表。
●安装Oracle客户端
●安装ETL服务端
●安装ETL客户端
●配置数据源
●使用Designer客户端,获取源数据表的元数据。
●使用Designer客户端,获取目标数据表的元数据。
●使用Designer客户端,设计一个Mapping,其中就是源->目标的ETL规则。
●使用Workflow Manager客户端,针对上面实现的Mapping,实例化一个Session,为其指定实际的数据源、目标连接,以及其他属性。
●使用Workflow Manager客户端,创建一个Workflow,其中包含上述的Session以及其他的Task,在Workflow中可实现复杂的流程控制。
●运行上述Workflow,使用Workflow Monitor客户端,检测最终的任务运行结果。
安装Oracle 11g Server端
●创建数据库
●建立资料库用户:Informatica PowerCenter 在安装之前,要在数据库下新建用户,用来管理资料库。(注意字符集的设定)
●用于建立源表和目标表,并存放数据。(数据仓库与资料库通常建立两个实例来区分开)
注意:11G与Windows Server 2012 不兼容
Step 1 仅安装数据库软件
一路下一步安装完毕
Step 2 创建数据库
启动 Database Configuration Assistant
选择创建数据库
选择定制数据库
全局数据库名就是实例名