【简介】数据仓库概述

什么是数据仓库?

数据仓库是由数据仓库之父比尔·恩门(Bill Inmon)提出,数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合。

主要用于组织积累的历史数据,并使用分析方法(OLAP、数据分析)进行分析整理,进而辅助决策,为管理者、企业系统提供数据支持,构建商业智能。

数据仓库的特点

面向主题

数据仓库是为数据分析服务的,而数据分析任务是有明确的主题任务的。比如,要分析用户行为特征,那就需要将业务数据库抽取过来的原始数据表进行聚合,然后集合成一张用户行为表;要分析用户的购买习惯,就需要将原始数据聚合成一张用户购买商品明细表。聚合后的表,便于之后相关主题的分析任务进行运算。

所以说,数据仓库是面向主题的,是指为主题明确的数据分析提供的数据聚合服务。

集成

数据仓库中的数据是来源于不同数据源的,因为企业的业务根据规模的不同,可能存在一个或多个业务系统。不同的数据源,对数据采用的规范可能各不相同。

如图所示,对性别的编码上,四个系统可能会采用不同的方式来表示男、女;在属性上,也可能有不同的差异,如使用不同的计量单位;甚至因为各个系统的分工不同,导致对同一张表的字段

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

桥路丶

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值