数据仓库基础知识

数据仓库是一个面向主题,集成的,相对稳定的,反映历史变化的数据集合,支持管理决策。其特征包括面向主题、集成、稳定和反映历史变化。区别于数据库,数据仓库主要用于分析而非事务处理。数据仓库建模方法包括ER模型和维度模型,常见的分层结构有ODS、DW和ADS层。事实表和维度表是其核心,元数据则提供了数据地图,帮助理解数据的全貌。
摘要由CSDN通过智能技术生成

什么是数据仓库?

数据仓库是一个面向主题,集成的,相对稳定的,反映历史变化的而数据集合,用于支持管理决策。

数仓的四大特征

  • 面向主题的
    • 传统的数据库是面向应用的,而数据仓库中的数据是面向主题的
    • 主题:是一个抽象概念,是较高层次上企业信息系统中的数据综合,归纳并进行分析利用的抽象。在逻辑意义上,是对应企业中某一宏观分析领域所涉及的分析对象。
    • 其中所谓较高层次是相对面向应用的数据组织方式,指按照主题进行数据组织的具有更高的数据抽象级别。
  • 集成的
    • 数据仓库的数据来源广,可能是从原有的多个数据库,数据文件,用户日志中抽取来的,数据来源既有内部数据也有外部数据。
    • 数据仓库中的数据很难从原有数据库系统中直接得到,数据在进入数据仓库之前需要经过统一与综合。
  • 稳定的
    • 数仓数据反应的是一段相当长时间内历史数据的内容。
    • 其稳定是相对于应用型数据库而言,一旦数据进入数据仓库之后,一般是被较长时间的保留,且很少更新通常只需要定期的加载和更新。
  • 反应历史变化的
    • 数据仓库的数据保存时间一般远远大于操作性数据库的时间
    • 业务数据存储的是当前数据,而数据仓库中的数据是历史数据
    • 数据仓库中的数据是按照顺序追加的,都带有时间属性

数据仓库的作用

  • 建立统一的数据中心,用于管理和决策
  • 产生业务报表,了解企业的经营状况
  • 作为各个业务的数据源,形成业务数据互相反馈的良性循环
  • 用户行为数据,通过数据挖掘来降低投入成本,提高投入效果
  • 开发数据产品,直接或间接地为企业盈利

数据仓库与数据库的区别

本质其实就是OLTP与OLAP的区别。

OLTP(联机事务处理),也称面向交易的处理系统。主要针对具体业务在数据库系统的日常操作(增加,删除,查询,修改),用户较关心操作的响应时间,数据的安全性,完整性和并发支持的用户数等问题。主要是用于操作型处理。
OLAP(联机分析处理)。一般针对某些主题的历史数据进行分析,支持管理决策。

  • 数据仓库是面向分析,面向主题的,是为了分析数据而设计的,用于解决企业级数据分析问题或管理和决策,属于分析型。数据库是面向事务的,为了捕获和存储数据而
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值