Oracle Data Integrator
ODI(Oracle Data Integrator)是Oracle在2006年10月收购Sunopsis公司后,整合Sunopsis Active Integration Platform而推出的一款数据集成工具,现在是Oracle Fusion Middleware的组件。和Oracle自己的OWB(Oracle Warehouse Build)相比,ODI支持更多的异构数据源,支持SOA,支持Jython,和OWB正好互补。ODI和OWB都是所谓的ELT工具,和通常所见的ETL工具不同,它们不是采用独立的引擎而是采用RDBMS进行数据转换。做为领先的RDBMS供应商,Oracle选择ELT而不是ETL不是没有道理的。
知识库
ODI所有模块的信息都保存在一个叫做Master Repository的中心知识库中。Master Repository通过Master Repository Creation Wizard创建,这也是安装完ODI后应该做的第一个任务。
除了Master Repository,还需要为不同的任务创建Work Repository。Work Repository中的信息包括模块信息,项目信息和运行期信息。
图形模块
Designer 用于定义数据转换逻辑,这是最常用的开发工具,大部分的开发任务,包括data store的定义,interface(数据映射关系)和package(相当于workflow)的创建等,都是在Designer中完成。
Operator用于管理和监控数据转换任务的执行情况,在设计阶段,也可用于调试(debugging)
Topology Manager用于定义物理和逻辑基础架构,如work repository的创建和管理等。
Security Manager用于管理用户权限
(
1、Topology manager定义物理和逻辑架构,就是配置不同库的url,sid什么的。
2、Designer进行数据传输的操作(不同库表数据的传输,传输方式很多种(牛B之处))
3、Operator查看数据传输的结果(传输成功,还是失败,失败的原因等等)。
)
运行期组件
Schedule Agent计划代理,用于调度执行数据转换任务。计划代理同时也带有一个数据转换引擎,但是ODI采用E-LT架构,所以基本上计划代理只是将任务传递给目标库,其数据转换引擎很少用到。
附:安装完ODI后默认用户名为SUPERVISOR,密码为SUNOPSIS,大小写敏感。
ODI开发(Oracle Data Integrator)
ODI就是一个导数的工具,用IMP,EXP加个FTP和定时crontab一样可以实现导数,只不过,odi更加强大,可以实现更多的功能,等你上个项目,当你接口实现不了需求的时候,你就知道要用存储过程了,odi可以刷新执行,定时执行,不同的库数据导给同一个库用来出报表,大致如此,没有必要扣什么数据挖掘,除非售前也归你,向客户兜售ODI,才需要扯一些什么数据仓储,数据挖掘之类的。
事实表和维表
事实表和维表多对一的关系。
比如事实表每条记录对应一次洗衣粉销售行为,其中一个字段为洗衣粉品牌代码;而维表中保存唯一的品牌和品牌代码,两表通过代码关联;这样就可以从品牌的角度对洗衣粉销售进行分析。
其实主要的区别我想是:
事实表是记录你要分析的东西;
维表是你要用来度量你要分析指标的东西;
就是说一个是对象,一个是尺度。
维度:
多维数据集的一种结构特性,是描述事实数据表中的数据的类别(级别)的有组织的层次结构。这些类别通常描述相似成员的集合,用户要根据它们进行分析。