数据仓库与数据库的区别

数据库是产品,数据仓库是在数据库已经大量存在的前提下,为进一步挖掘数据资源,提供决策解决方案而产生的;

数据库是面向事务的设计,数据仓库是面向主题设计的。数据库是为应用程序进行数据处理,数据仓库是进行数据分析工作的,若农贸市场小贩(应用程序)的摊位各种菜(数据)都有,即相当于数据库,超市的菜都是都是白菜萝卜按主题分类存放的。

数据库并不一定强调要有时间信息,数据仓库中的数据都要表明时间属性。

数据仓库来源于其他数据库,并不是最新的,它反映历史数据,因此一般不修改,只增加。

数据仓库并不是取代数据库,大部分数据仓库都是用关系型数据库来管理的。

数据库一般存储在线交易数据,数据仓库存储历史数据

数据库的设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库的设计是有意引入冗余,采用反范式的方式来设计。

数据库为捕捉数据而设计,数据仓库为分析数据而设计,它的两个基本元素是维表和事实表。

数据仓库是用于为决策者提供信息的,数据仓库必须来自许多源的数据集合和合并并为一致的数据集,以准确反映单位运营情况和历史记录。

数据库主要用于联机事务处理(OLTP),数据仓库主要用于OLAP

一个单位通常有多个OLTP系统来捕捉日常的业务运作情况,这些OLTP很少与数据仓库一同设计。

举例说明:

以银行为例,数据库是一个事务系统的数据平台,客户在银行做的每笔交易都要记录在数据库中。数据仓库是分析系统的数据平台,数据仓库是分析系统的数据平台,它从事务系统中获取数据,汇总加工,为决策者提供依据。显然银行的交易量是巨大的,数据库系统是实时性的,这要求时效性,客户需要存一笔钱要花几十秒是无法忍受的,这就要求数据库只能存放很短一段时间的数据,而数据分析是事后的,尽管这些数据时海量的,汇总也很慢,但它提供的有效数据达到了分析的目的。

概念定义:

1.维表:维是看问题的角度,如时间,部门,维表放的是这些东西的定义,

事实表:事实表里存放要查询的数据,同时又维的ID。

数据仓库的四个特点:面向主题的,集成的,相对稳定的,反映历史变化的。

1)面向主题:平时的数据库是面向事务性的,各个任务系统是相互分离的,数据仓库是面向某一个主题域进行组织和分析的。主题是指用户在做决策时关心的重点方面,一个主题一般包含多个业务领域。如销售信息分析,客户属性分析都是主题。

2)集成:

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值