第二章、表格结构数据与表结构数据(5)

第2章、表格结构数据与表结构数据(5)

六、表结构数据的汇总
1、透视分析的业务意义

数据分析:数据分析的本质意义是连接零散数据记录与人类认知之间的桥梁。数据量过大,已经远远超出人类认知的极限,因此需要某种方法,将这些过于庞大、零散的数据记录转化为人类可以认知的信息,这种方法就是数据分析。

将数据转化为人类可以认知的信息的两类数据分析方法:

(1)数据透视分析方法

数据透视分析方法就是将零散数据放置于特定业务角度下进行汇总观测。几亿行零散的交易数据人类无法认知,但是汇总为几万行有意义的品牌下销量的汇总数据,就可以帮助决策者了解过去发生的品牌维度下的实际业务情况。

【通过汇总得到的信息是对以往业务场景的事实描述,所以这种方法归类为业务描述性分析。】

(2)数据挖掘方法

数据挖掘方法就是通过算法深入挖掘数据间的内在规律及联系,通过这些规律及联系对业务产生更深层的理解,并且在这些规律及联系的延长线上做出对未来的预测判断,这种方法就是数据挖掘方法。

【数据挖掘方法既包含描述性分析,也包含预测性分析的内容。】

2、数据分析的操作思路

(1)选好业务角度:想做好数据透视分析,首先要选对维度,也就是要根据业务需求,选好观测业务问题的业务角度。

(2)维度数据全面:在选取维度数据的过程中,需要我们尽量保障维度数据的全面性,尽量将所要分析业务涉及的所有相关维度的数据找全。

(3)多维数据集:要让找到的维度数据能够彼此识别到对方,也就是要搭建多维数据集。获取多维数据的过程可通过ETL功能实现,而创建多维数据集则需要使用OLAP 技术实现。

(4)度量汇总计算:通过多维数据集解决了维度问题后,还需要解决针对度量的汇总计算规则的创建问题。如果说度量是业务行为的结果,那么汇总计算规则就是帮助我们了解业务行为结果好坏程度的测量仪。

3、数据透视分析的计算逻辑

(1)生成数据透视图表的方法:除数据库需要编写SQL命令才能得到透视结果外,不管是电子表格工具还是表结构分析工具,绝大多数情况下都需要通过拖曳字段的方式来生成数据透视图、表。

(2)通过拖曳字段的方式来生成数据透视图、表的步骤:
1创建数据透视图、表模板。2选择维度字段拖入适当位置。3选择度量字段拖入适当位置。4决定维度对度量进行汇总计算时使用的计算规则。

(3)维度、度量和汇总计算规则

通过数据透视图、表得到的任何结果都是在维度、度量、汇总计算规则这3个要素共同作用下生成的。进行透视分析类似于玩拼图游戏,需要分析人员先根据业务需求找准维度字段、度量字段,以及提前想好正确的汇总计算规则,再将准备好的这3部分“图片”拼接在一起才能得到有业务参照价值的数据透视结果。

维度是业务行为的相关角度,度量是业务行为的结果,将度量放在某些维度下进行汇总观测,就可以描述出在某些相关业务角度下发生过的实际业务情况。

(4)筛选

维度对度量进行汇总计算的过程称为筛选。我们可以将维度汇总度量的过程表述为维度筛选度量,或者度量被维度筛选。

(5)汇总计算规则
在业务描述性分析中有5种常用的汇总计算规则:合计规则,计数规则、平均规则、最大值规则及最小值规则。

聚合类函数:通过函数的形式为度量字段指定汇总计算规则。聚合类函数中的参数就是作为汇总对象使用的度量字段,而聚合类函数的函数表达式代表了不同的汇总计算规则。



 

  • 5
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值