多维数据模型中维度、度量、层级理解

多维数据模型中维度、度量、层级理解

本文只是对多维数据模型中维度、度量、层级理解的通俗理解,当然不止这些,还会涉及到更多具体细节的概念,本文对此不做介绍。

1. 如何认识(看)对象?

当人去看、去观测一个事物,一个对象的时候,总是不能回避的是观测方向。和观测角度、观测属性、观测维度、观测特征同义。
角度,属性、方向、维度、特征这些都是同一概念,都是对象本身的属性。去看这个对象时,总是从一个或者多个属性来看这个对象。比如我们看一个在三维空间的一部手机,我们最直观的会看到它的长、宽、高。
长、宽、高是三个手机的三个属性,每个属性有具体的数值。这三个角度,放到坐标系,分别对应三维空间的x, y, z轴,即我们是从三维角度去看这个手机,对这个手机有了三个维度的认识。
如果你的认知只是三维,那你获得的信息,就只能是这个长宽高三个角度的信息,你对手机的认知就只是三维的东西。
现在你的三维空间又有一个纸箱,你的认知是三维的,那么你看这个纸箱,只是长宽高三个维度。那么对你来说,纸箱和杯子又有什么区别呢?除了长宽高的值不同,再无不同。
你说手机是黑色的,纸箱是灰色的。灰色黑色就是第四个维度,通过第四个维度来区别。你还说手机有操作系统,有界面,有电池,有app…你会列出很多不同的维度,当你用这些维度的时候,
其实就是用这些维度,不同的角度去看手机,你现在使用多个维度去观看,认识手机了,就不仅限于长宽高三个维度了。
所以说,我们是从维度、角度、方向去看去(看)对象的。
当我们看一个人的时候,你会认识到他的姓名、年龄、事迹、历史地位、收入、性格、人品、是否有车、是否有保险、手机型号、贷款金额、走路姿势等等维度去更全面认识一个人,但我们基本上是仅凭几个特殊、特有维度来区别这个人和其他人。
对于对象的认识可以是无穷维度的认识,但对象有区别于其他类别物体的特有维度,和维度值范围。

2. 如何区别物体?

个人认为:
物体区别于物体的本质标准在于特有维度和维度值的范围。
不同类,即便同类物品有自己特有的维度以及维度的固有范围。

3. 度量、维度、层次、级别

原始数据中,一条数据,可以看作为一个对象,该对象全是属性、维度,如下记录描述一些人的信息:
科室 性别 工资
A 男性 7000
A 男性 8000
B 女性 7500
B 女性 9000
B 男性 7000
B 男性 8000
A 女性 7500
A 女性 9000
C 男性 8000
C 女性 7500
C 女性 9000
这三个属性都是对人的一种描述(可能还有其他属性,此处只列出3个属性),三个属性就是人的三个特征,三个维度。
此时提出关注点和统计需求:
统计A、C科室女性的的总工资,最高工资,最低工资,平均工资,工资方差。
统计步骤:
1.进行分组:把A、C科室女性叫到一起,即分到一个组。此处是根据两个属性:科室、姓别(两个维度)的值A、C,女性,进行限定,把她们分到一个组中。
2.统计、计算:对这个组里所有人的工资属性进行计算,计算出总工资,最高工资,最低工资,平均工资,工资方差。
维度就是人的三个属性:科室 性别 工资。
度量是什么?
是总工资,最高工资,最低工资,平均工资,工资方差。非常明显地看出,都是对工资这个属性上加了计算!是维度的测量。英文对应measure,就有测量的意思,测量什么?测量的是某个属性(维度),是我想关注和想看的一个属性。
测量哪些对象的该属性呢?A、C科室女性。
度量是可计算、比较、可比较、可测量的属性,工资是我们想看的属性,特征,维度。想看工资的什么统计量呢?想看工资的总、最高、最低、方差。
度量也是维度,是我想关注的维度的测量统计。所以度量就是一个观测角度。本例中,我想通过收入角度去看(了解)这些人(人由科室 性别 工资三个维度构成)。

层次和级别是什么?
科室 A、C,性别女性是对科室和性别两个两个维度做了限制。两个维度有很多值,想看哪些人的工资呢?如果不做限制,就是所有人的,本例限定科室 A、C,性别女性。

我们规定科室A、C为销售部门、B为技术部门。那么原需求可表述为:统计销售部门女性的总工资,最高工资,最低工资,平均工资,工资方差。
A、C科室为销售部门起到了什么作用?是对科室属性中所有科室值A B C进行的一种划分(分组),把这种划分方式叫做:按科室职能划分。
科室职能这种划分把所有科室分成了:销售部门、技术部门。把划分方式叫做层次划分,划分的依据是层次,依据科室职能层次划分。
销售部门、技术部门是按照科室职能层次划分出来的的两个部分,叫做级别,即销售部门、技术部门两个级别。
当然,科室还有其他层次的划分方式。
概括地说,维度和度量的概念是:多维度多条件下观测维度的测量,多因素条件下的关注量的统计,或者说多因素多条件下综合、定位限定所聚焦的、关注的维度统计。
关注的,想看的是某个维度的测量统计量,其他维度的层次、级别是对度量的测量范围的限定。
度量具体值和其他维度具体值本身就是相互映射,相关的,存在一种映射关系 ,维度层级来做限定范围,映射的度量进行计算。

当统计的对象是一条明细时:
员工编号 科室 性别 工资
01 A 男性 7000
统计员工编号01,A科室性别女性的的总工资,最高工资,最低工资,平均工资,工资方差。
本质和上述概念一致,是对一个人的工资的相关统计,计算。和多个人,多组人,没有本质区别。都是对要统计工资的人的人数和范围的限定。

4. 数据库表设计上的体现

设计FACT表时,如果Fact表只是最基础的聚合,其中group by dept, sex 是分组值,是观测维度。 where deptclass = '职能部门’是维度的限制条件,是层级的概念。
sum(sal)、max(sal)等是度量的计算,是我关注的维度的计算。
为什么有group by分组呢?因为我关注的是一个群体对象,群体记录的相关维度(度量)的统计,所以是要分组的,哪些群体呢?是要分层级的。
。。。。。。。。。
待完善。。。。。。

5. Cube模型的体现

 。。。。。。。。。
 待完善。。。。。。

7. 数学坐标系理解多维数据

 。。。。。。。。。
 待完善。。。。。。

8. 指标的理解

指标是不但具备自身的业务含义,更是组织和划分数据的方式。指标也是多因素条件下的关注量(的统计)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值