数据仓库基础知识

什么是数据仓库?

数据仓库是一个面向主题,集成的,相对稳定的,反映历史变化的而数据集合,用于支持管理决策。

数仓的四大特征

  • 面向主题的
    • 传统的数据库是面向应用的,而数据仓库中的数据是面向主题的
    • 主题:是一个抽象概念,是较高层次上企业信息系统中的数据综合,归纳并进行分析利用的抽象。在逻辑意义上,是对应企业中某一宏观分析领域所涉及的分析对象。
    • 其中所谓较高层次是相对面向应用的数据组织方式,指按照主题进行数据组织的具有更高的数据抽象级别。
  • 集成的
    • 数据仓库的数据来源广,可能是从原有的多个数据库,数据文件,用户日志中抽取来的,数据来源既有内部数据也有外部数据。
    • 数据仓库中的数据很难从原有数据库系统中直接得到,数据在进入数据仓库之前需要经过统一与综合。
  • 稳定的
    • 数仓数据反应的是一段相当长时间内历史数据的内容。
    • 其稳定是相对于应用型数据库而言,一旦数据进入数据仓库之后,一般是被较长时间的保留,且很少更新通常只需要定期的加载和更新。
  • 反应历史变化的
    • 数据仓库的数据保存时间一般远远大于操作性数据库的时间
    • 业务数据存储的是当前数据,而数据仓库中的数据是历史数据
    • 数据仓库中的数据是按照顺序追加的,都带有时间属性

数据仓库的作用

  • 建立统一的数据中心,用于管理和决策
  • 产生业务报表,了解企业的经营状况
  • 作为各个业务的数据源,形成业务数据互相反馈的良性循环
  • 用户行为数据,通过数据挖掘来降低投入成本,提高投入效果
  • 开发数据产品,直接或间接地为企业盈利

数据仓库与数据库的区别

本质其实就是OLTP与OLAP的区别。

OLTP(联机事务处理),也称面向交易的处理系统。主要针对具体业务在数据库系统的日常操作(增加,删除,查询,修改),用户较关心操作的响应时间,数据的安全性,完整性和并发支持的用户数等问题。主要是用于操作型处理。
OLAP(联机分析处理)。一般针对某些主题的历史数据进行分析,支持管理决策。

  • 数据仓库是面向分析,面向主题的,是为了分析数据而设计的,用于解决企业级数据分析问题或管理和决策,属于分析型。数据库是面向事务的,为了捕获和存储数据而 设计,属于操作型。
  • 数据仓库设计是有意引入冗余数据(目的是为了提高查询的效率),采用反范式的方式来设计;数据库的设计是尽量避免冗余,一般符合三范式的设计
  • 数据仓
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
第一章对数据仓库的迫切需求...................................................................................................23 本章目标:.............................................................................................................................23 对战略性信息的迫切需求.....................................................................................................24 信息危机.................................................................................................................................26 技术趋势.................................................................................................................................27 机遇和风险.............................................................................................................................28 过去决策支持系统的失败.....................................................................................................29 决策支持系统的历史.............................................................................................................30 不能提供信息.........................................................................................................................31 操作型系统和决策支持系统.................................................................................................31 使商业运转起来.............................................................................................................31 监视商业的运转.............................................................................................................32 不同的范围,不同的目的.............................................................................................32 数据仓库——唯一可行的解决方案.....................................................................................33 一种新类型的系统环境.................................................................................................34 新环境的需求处理.........................................................................................................34 数据仓库的商业智能.......................................................................

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值