传统的异种数据库集成:
* 在多个异种数据库建立包装程序和中介程序。
* 查询驱动方法--当从客户端过来一个查询时,首先使用元数据字典将查询转换成相应异种数据库上的查询;然后,将这些查询映射和发送到局部查询处理器。
* 缺点:复杂的信息过滤和集成处理,竞争资源
数据仓库:更新驱动
* 将多个来自多个异种源的信息预先集成,并存储在数据仓库中,供直接查询和分析
* 高性能
数据仓库与操作数据库系统
操作数据系统的主要任务是联机事物处理OLTP:日常操作
数据仓库的主要任务是联机分析处理OLAP:数据分析和决策
OLTP和OLAP主要区别:
1.用户和系统的面向性:顾客VS市场
2.数据内容:当前的、详细的数据VS历史的、汇总的数据
3.数据库设计:实体--联系模型(ER)和面向应用的数据库设计VS星型/雪花模型和面向主题的数据库设计
4.视图:当前的、企业内部的数据VS经历演化的、集成的数据
5、访问模式:事务操作VS只读查询(很多事复杂的查询)
OLTP系统和OLAP系统
分无特点:操作处理vs信息处理
任务单位:简短的事务vs复杂的查询
用户:办事员、DBA、数据库专业人员vs经理、主管、数据分析员
度量:事务吞吐量vs查询吞吐量、响应时间
DB规模:100M-数GM VS 100GB-数TB
访问数据量:数十个vs数百万个
用户数:数千个vs数百个
视图:详细的二维关系型vs汇总的、多维的
优先性:高性能、高可用性vs高灵活性、端点用户自治