数据仓库工具箱-学习笔记2-数据仓库、商业智能及维度建模初步

数据仓库工具箱-学习笔记2(chapter1数据仓库、商业智能及维度建模初步)

作者认为,没有必要纠结于技术,因为技术只是实现业务的工具,它会更新会变化,而真正根源是解决业务问题,至于什么技术实现不必纠结,探讨的是逻辑设计物理设计采用的相关技术和工具的决策和选定。
一、三个重要概念
1.数据仓库 DW(Data Werehousing)、
2.商业智能 BI(Business Intelligence)、
3.维度建模初步 (DW/BI的展现技术)
二、信息的两个目的
1.操作型记录的保存(用户获取订单、下单、付款等)
–>不必维护历史,只需要满足当下业务反馈
2.分析型决策的制定(一周内的订单比较,商品订单量等)
–>需要维护历史,用于做精准的分析和评估

任何工具或者概念的提出都不是夸夸其谈,纸上谈兵,而是为了解决某些问题,被人们发明或者引申出来的。数据仓库和商业智能同样如此,他们的存在大抵是为了解决如下的问题:
1.我们收集了海量数据,但无法访问
2.我们需要以各种方式方便对数据进行切片及切块
3.业务人员需要方便的获得数据
4.将最重要的展示给我
5.会议自始至终争论的是谁的数字正确,而不是指定决策
6.我们希望人们能够使用信息来支持更多的基于事实的决策组制定
转化DW/BI的需求则是:
1.DW/BI系统要能方便地存储信息
2.DW/BI系统必须以一致的形式展示信息
3.DW/BI系统必须能够适应变化
4.DW/BI系统必须能够及时展现信息
5.DW/BI系统必须成为保护信息财富安全的堡垒
6.DW/BI系统必须成为提高决策制定能力的权威和可信的基础(important)
7.DW/BI系统成功的标志是业务群体接受DW/BI系统(important)

作为小白,必须同时提升信息技术业务能力才能适应整体的节奏。上述的观点均是趋向于用户和业务,所以这两个点万万不能忽视,仅学技术好比站在岸上学不会有用,只能狗刨空气!

三、维度建模简介
维度建模的目的是:
1.以商业用户可理解的方式发布数据
2.提供高效的查询性能
简单性至为重要,目的是为了便于用户去理解数据,确保软件能够快速、有效的发布结果!至理名言:‘凡是应该尽量简单,直到不能再简单为止

四、维度建模模型
星型模型、OLAP多维数据库
在这里插入图片描述维度建模最常用的两种方式:星型模型、OLAP多维数据库

五、度量和维度
‘事实’ 这个术语表示某个业务度量。例如
在这里插入图片描述右图中事实表中,每一行都是一种度量事件,而每一行的具体数据称为**粒度。同一个事实表中,所有的度量都必须具备相同粒度!!**这样才能确保,数据不会出现重复计算的问题。一般事实表会有两个或者更多外键与维度表的主键关联。可以通过维度表的连接来实现对事实的表达。

最实用的事实1.数值类型 (商品金额) 2.可加类型 (销售数量、销售额度)
另外还有 3.半可加类型 (商户余额) 4.不可加类型 (商品单价)

事实通常以连续值描述!

物理学的角度来说,每一个度量事件与对应的事实表行,具有一对一的关系,这一思想是维度建模的基本原则。

总结:事实=度量

事实粒度可分为:
1.事务 2.周期性快照 3.累计快照

用户描述环境的维度表
用户描述:谁、什么、哪里、合适、如何、为什么

维度表通常列多,包含诸多属性。数据仓库的好坏直接取决于维度属性的设置。维度通常描述某样东西的特征,作为查询中的约束、分组、报表标识来源。

度量和维度如何设计
一个数字量到底是事实还是维度属性,对于我们开发者来说,很难做出决策。一般而言,连续值数字基本上可以认为属于事实,来自于一个不太大的列表的离散数字基本可以认为是维度属性。
例如产品对应的品牌名称类别名称。是属于维度的。

事实表和维度表的结合
使用图表做设计更容易被用户理解,且维度表拓展性要求高,必须要有适应变化的能力。粒度最小的数据会具备最多的维度。尚未聚合的原子数据,最具有可表达性

如下案例,证明报表中需要维度属性,且需要它作为分组或者聚合
在这里插入图片描述在这里插入图片描述

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值