数据库与数据仓库概念

企业数据处理大致可以分为两大类:操作型处理和分析型处理。相应地数据库的应用分为操作级和信息分析级两个层面。两者之间存在着巨大的差异。操作型处理也叫事务处理,是指对数据库联机的日常操作,通常是对一个或一组记录的查询和修改,主要是为企业特定应用服务的,人们关心的是响应时间、数据的安全性和完整性;分析型处理主要是对历史数据进行分析和推理,为决策提供依据。
传统数据库系统适于企业的日常事务处理工作,而难于实现对数据分析处理要求。
信息分析处理所涉及的数据主要是历史数据,由于历史数据库往往是巨量的(GB级),并且相应的数据查询也较复杂,因此,通常的DBMS技术就出现了如下困难:①缺乏组织。各部门进行分析时,为了不影响联机效率,并取得对数据的完全控制,都是从原始数据上抽取本部门所需的数据进行分析,对每个部分数据进行抽取再抽取,就形成了所谓的蜘蛛网(Spide Web)。网上任意两个节点的数据可能来自一个原始数据,由于数据时间不统一,抽取方法和级别也不同,并且可能参考了不同的外部数据,所以对同一问题的分析,不同的节点会产生不同或相反的结果,从而无法支持DSS(Decision Support System,决策支持系统)应用。②效率较低。对于巨量的历史数据库,分析所需的数据可能分散在许多应用中,同一属性可能存在同名异义、异名同义等,要想形成一个统计分析报告,需要将各处的数据统一起来,通过对有用信息的抽取再抽取,最终形成整体报告。但随着时间的推移,报告的更新是困难的。
“数据仓库是作为决策支持系统服务基础的分析型数据库,用来存放大容量的只读数据,为制定决策提供所需的信息。”
“数据仓库是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的(即与企业定义的时间区段相关)、面向主题及不可更新的数据集合。”
这些观点都或多或少道出了数据仓库及其数据的特点,如为制定决策服务、面向主题、数据的不可更新等。
William H.Inmon在他的一本具有里程碑意义的书“Building the Data Warehouse”中定义数据仓库为“一个面向主题的、集成的、时变的、非易失的数据集合,用于支持管理层的决策过程”

所有传统的数据库和数据仓库在面向的应用和基本特征方面都存在着很大的差别。

当然在具体数据仓库的实施的时候,我们可能还是在现有的数据库产品上进行实现。因为现在的数据库商业产品中基本上都实现了一部分数据库仓库的功能,当然作为一个完整的数据仓库解决方案还需要包含很多的内容
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值