PART 5 多维数据透视分析(占 比 10%)
总体要求
理解多维数据模型价值、理解多维数据模型逻辑、理解透视分析原理、能够活用多维数据模型结合恰当透视方法观测业务问题实现商业洞察
1、多表透视分析逻辑(占比 3%)
【熟知】
熟知透视分析的作用价值
维度:行列标签
理解多表环境下的连接、透视逻辑
星型模式:由一个事实表和一组维度表组成,维度表只和事实表关联,维度表之间没有关联,以事实表为核心,维度表围绕核心呈星形分布。
订单表、产品表与客户表:一个事实表连接两个维度表是星型模式
雪花模式:雪花模型相当于将星形模式的大维度表拆分成小维度表,满足了规范化设计。多维表对应单事实表。
订单表、产品表与品牌表:单表是事实表,展开产品与品牌两层维度表,展开多层维度是雪花模式
星座模式:事实表不止一个,而一个维表也可能被多个事实表用到。
交叉连接:
【应用】
能够通过表的字段理解该表所代表的业务维度及业务意义,能够通过表的业务意义倒推回表中字段的主键、维度、度量属性
主键的业务意义:表的业务记录单位
2、多维数据模型(占比 3%)
【领会】
了解使用多维数据模型的业务意义
【熟知】
熟知多维数据模型的创建方法
熟知多维数据模型中连接方式与汇总结果间的关系
关键字段:主表附表都有,字段名不一定相同,但值要对应,不能有重复值
横向合并:存放最终合并结果的表为主表;为主表提供必要信息的为附表
当两表用于合并的关键字段值不是一一对应,不同连接种类会有不同的结果
当关键字有重复值,连接后总行数为关键字段值重复出现次数的乘积
纵向合并:将有相同字段名的字段纵向合并到一起
将不同字段名的字段追加到最后
非匹配字段标记为null
关键字段中有重复值的表为主表(*),无重复值的表为附表(1),在数据透视表中,只有当行列标签来自附表时,附表才能提供值字段,否则汇总值出现错误
汇总原则:一表出维度,一对多的连接关系
筛选器方向:单向:维度指向度量(维度筛选度量,箭头出发一侧为维度)
双向:两表间互为筛选
谁出度量谁是主表
熟知多维数据模型下汇总维度与筛选维度间的差异及各自的适用场景
【应用】
能够通过 5W2H 思维模型梳理业务线索,搜集完整的多表数据。
5W2H模型:what why who when where how how much
能够根据业务需求,按照正确的连接关系创建完整、准确、全面的多维数据模型 能够根据多维数据模型推导出可探索的业务问题范围,实现业务洞察
3、透视分析方法(占比 4%)
【领会】
透视分析的价值及意义
【熟知】
熟知基本透视规则:求和、求平均、计数、最大最小值
熟知条件筛选透视规则:多条件透视计算、不同层级维度透视计算
熟知基本对比计算规则:均比、基准比、标准比、百分比、差异百分比
均比:实际值与平均值对比 同类型产品销售情况
基准比:实际值与基准值之间的对比 成绩水平
目标比:实际值与目标值之间对比 销售业绩绩效
标准比:实际值与标准值对比 工场工作水平绩效
占比:部分与总体对比 不同区域销售额占比
熟知时间维度下的透视计算规则:不同时间段、不同时间位移量下的透视计算规则
熟知行间透视与字段上透视的差异
【应用】
能够根据业务需求选择创建正确的透视规则
能够将透视规则应用在正确的多维模型下描述业务问题 能够通过透视结果理解业务问题
透视结果与预期结果不符时,能够检查、追踪问题原因