从数据库到数据仓库

数据库系统作为数据库管理的主要手段,主要用于事务处理。在这些数据库中已经保存了大量的日常业务数据。传统的决策支持系统(DSS)一般是直接建立在这种事务处理环境上的。
数据库技术在事务处理、批处理、分析处理等方面发挥了巨大的作用,但它对分析处理的支持一致不能令人满意,尤其是当已事务处理为主的联机事务处理(OLTP)应用与以分析处理为主的DSS应用共存时,人们逐渐认识到事务处理和分析处理具有不同的特征。
以下原因将导致事务处理环境不适宜DSS应用:
(1)事务处理和分析处理的特征不同。在事务处理环境中,用户的行为特点是数据存取操作频率高而每次操作处理的时间短,因此系统可以允许多个用户按分时方式使用系统资源,同时保持较短的响应时间。在分析处理环境中,某个DSS应用程序可能需要连续运行几小时,消耗大量的系统资源。
(2)数据集成问题。全面、正确、大量的数据是有效分析和决策的前提,相关数据收集的越完整,从中得到的结果就越可靠、越有价值。DSS过程中不仅需要企业内部各部门的相关数据,还需要企业外部,竞争对手,现在的、历史的等相关数据,即DSS需要集成数据。
    事务处理的目的比较简单,主要是事务处理的自动化。一般只涉及较少的当前数据,对整个企业范围内的、历史的集成的应用考虑得很少。如许多使用数据库的地方,数据的真正状况是分散而非集成的,能产生丰富的细节数据,但这些数据却不能成为一个统一的整体。对于需要集成数据的DSS应用来说,必须自己在应用程序中对这些纷杂的数据进行集成。
数据集成是十分繁杂的工作,若交由应用程序完成,将大大增加程序员的负担,并且每次分析都要进行一次集成,将导致极低的处理效率。DSS对数据集成的迫切需要是数据仓库技术的最重要原因。
(3)数据动态集成问题。因为进行数据集成的开销太大,若一个应用只在开始是对所需的数据进行一次集成,以后就一直以这部分集成的数据作为分析的基础,不在与原数据源发生联系,称这种方式的集成为静态集成。静态集成的最大的缺点在于如果在数据集成后数据源发生了变化,这些变化将不能反映给决策者,导致决策者使用的是过时的数据。因此,集成数据必须以一定的周期(例如几天或即州)进行刷新,成为动态集成。事务处理系统不具备动态集成的能力。
(4)历史数据问题。事务处理一般只需要当前数据,在数据库中一般也只存储短期数据,且不同数据保存期限也不一样,即使保存下来的历史数据,也不能充分利用。但对于决策分析而言,历史数据是相当重要的,对于趋势分析等许多分析应用来说,必须以大量的历史数据为依托。
综上可见,DSS对数据在空间和时间广度上都有了更高的要求。而事务处理环境难以满足这些要求。
数据的综合问题。事务处理系统往往积累了大量的细节数据,但不具备对这些数据的综合能力。 DSS 并不需要直接对这些细节数据进行分析,而是在分析前先要对细节数据进行综合。以上这些问题表明,在事务型环境中直接构建分析型应用是很困难的。要从本质上解决这些问题,就需要提高分析、决策的效率和结论的有效性。分析型处理及其数据必须与操作型处理和数据分离,必须把分析数据从事务处理环境中提取出来,按照 DSS 处理的需要进行重新组织,建立单独的分析处理环境。数据仓库正是为了构建这种新的分析处理环境而出现的一种数据存储和组织技术。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值