数据模型关系
1.关系:是在数据源逻辑层中的逻辑表之间,创建的灵活的连接线,用于描述两个表如何基于公共字段相互关联,但不将表合并在一起。
2.关系是合并数据的一种新方式。
一、需求:各年度、各类别的销售额与销售目标的达成情况:
1.在Excel中-清洗处理商品交易明细表
销售表和目标表是独立的,如果要实现两张表的需求,基于两个表做聚合(数据透视表)之后再连接的过程,在Excel中做连接要用的是vlookup,到那时需要同时用两个字段去匹配,因此去处理这样的问题的时候它本身就不适合的,而且透视表中的类别下其实有很多空无法填充。所以我们就将问题迁移到tableau中看看如何解决?
例如:
1.在tableau中导入商品交易明细表,构建工作表为销售额表
构建出与透视表类似的表:
在点击选择商品交易明细表的情况下再点击销售目标表,相当于我们在商品交易明细表中打开了销售目标表的字段,目标表中两个字段自动匹配
出现了两个连接符,就说明我们当前的这个数据表和我另一个数据表,他们在相同层级上做了聚合之后又做了连接。
总结:
二、需求:排除退货的销售数据,看一下各个年度各个类别的销售额和目标:
重新构建步骤:
当前的问题:一个年份(季度、月份)中所有的销售目标都是相同的,原因就是目前的关系设定就是年=年,所以不管你左边的层级怎么调整,通过数据关系拿过来的数据都是按照每个类别每年的销售目标
当前的关系并不是真正的模型,因为一点问题改变它就失效,因此我们要去做的数据关系,实际上不是简单的以你的问题或需求决定了你的数据关系的匹配,数据关系之所以成为模型,它具有扩展性,具备2个要素:
1、当前数据所能达到的最细的(最低)的聚合度(你的两个表的数据层级是什么)
2.业务上具有意义
在视图中加入“细分”,会出现数据不全的情况,原因是:数据源出现了问题-----销售目标中的细分里的字段与商品明细里的细分字段不一致而导致,字段名不匹配,导致数据匹配不上。
解决:
点击应用和确定
此时数据补全。
一、基础计算:
ABS(数字):返回给定数字的绝对值
添加盈亏标记:
在“利润”或在左边字段栏中任何一个空白处,右击--创建--计算字段,如上图,最后会得到盈利情况。
)行级别计算VS聚合级别
**示例1:根据数据源中的利润和销售额字段,计算利润率
聚合利润率
非聚合利润率
此时查看数据时发现,数据源中聚合与非聚合利润率显示为0;解决办法:
先点击聚合或非聚合利润率----选择设置格式-----在数字---选择百分比,2位数-----也可以在上方字段出选择。
1.每个订单ID中添加小计时:出现了,非聚合利润率-----上下加在一起做了求和---并求平均
此时发现,非聚合利润率是不对的,因为非聚合是通过以每个值之间的计算,聚合利润率是以每个值的合计进行计算的
示例2:针对各品类盈亏结构进行分析
1.首先--建立产品分层:将子类别拖拽到类别上,进行分层;
我们将利润放两次到列中,之所以放两次到列中,是因为要进对比
聚合利润率:先聚合,后判断 非聚合利润率:先判断,后聚合
所以再做结构类分析的时候可以优先考虑非聚合的形式计算
示例3 想了解正利润订单和负利润订单的占比:以上只是实现了数量,还有占比的计算-----正的和负的数据除以总数----也就是合计的百分比(总计的百分比)------创建快速表计算
但是需要让计算出来的每一个类别都是100%,需要添加计算依据
2.表计算:
利润不同对比方式:累计汇总
2)差异——后一项和前一项的利润差
3)移动平均:快速表计算中的移动平均默认都是3个数值的平均值
移动平均值=(每三个月的利润总和的平均)
如果你想计算4个值的移动平均,则需要用到自定义表计算(计算字段)
如果需要移动的月份(行数)需要随时改变,不可能一直写公式,所以可以将移动的月份数用参数来替代,将参数替换掉公式中的3的位置
接着点击 移动平均步长--显示参数--可以调节
产品结构分析
**需求1:分析是否是80%的利润额来源于20%的大客户,或者是别的情况
是否是80%的利润额来源:累计汇总
是个人的累计汇总
还有就是:每一个人的值去除以总的利润的总额
针对客户做相应的占比(例如:80.1%的夏伯的利润是不是来自于20%的客户),还需要将客户的名称放置在详细信息中(客户名称要在视图中,但是不影响视图的展示)
5)同环比分析
需求1:年度订单的销售总额及年同比差异
需求:在每个细分市场中对各年度的销售额求和以及同比计算*
**需求:各年度各季度的环比销售分析
各个季度的同比分析:
LOD计算:
示例:新客户增长分析
需求:每个市场、每天的累计新客户数据
可以拆分进行分析:
1.每个市场、每天的客户数:
在列中双击,把订购日期右击拖拽到列中,选择不同计数
2.例如:每个市场、每天的桌子客户数:
3.每个市场、每天的新客户数:就要得到第一次来店购买的日期,才是新用户。
先得到首次购买日期:{FIXED [客户ID]:min([订购日期])}可以得到首次购买日期
然后通过首次购买日期 = 订购日期 可以得到每个客户的第一次进行购买的日期为真
4.每个市场、每天的累计新客户数
客户购买频次的分析
1.购买频次:就是每个客户购买商品的次数
我们先要得到每个客户购买订单的数量:先放置订单ID进行不同计算, {FIXED [客户名称]:COUNTD([订单id])}完成,
拖拽到列中,在每个客户订单数进行维度,然后离散选择------左后对客户名称进行不同计算
2、从多维角度分析产品结构
1)基础分析:各子类别的销售额和利润的情况分析
是不是销售额越多、利润越高,就值得表扬??
假设1:有些销售额不高,但利润很高的产品(收纳具),有些销售额很高,但利润不佳的产品(器具),是不是因为有些类别过度的营销而导致他的亏损
假设2:一个订单中有少量的亏损,但是整个订单是盈利的
验证2:订单的利润是否亏损
在列中在放一个利润来进行分析,通过fixed来详细分析{FIXED [订单ID]:sum(利润)}
然后在{FIXED [订单ID]:sum(利润)}>0 判断说明:
没法保证每一笔订单都是盈利的,有的赠送的产品是单独一个订单发出去的,所以这个订单是亏损的,但是从这个客户身上是盈利的
验证3:每个客户的销售利润
{ FIXED[客户名称]:SUM([利润]) }
客户矩阵分析(具有相同特征人群的分析)
需求:不同订单年度、不同获客年度的 销售总额及其占比(相同时间段内来的客户是一个相同的矩阵)
获客日期:客户的首次购买日期——每个客户的首次购买日期
{ FIXED [客户名称]:MIN([订单日期])}
结果:通过视图结果发现,2017年的老客户在后面几年中的销售额都贡献了超过一半以上,2017年的客户粘性最强 ,同时后面几年的增速放缓,对于新客户的纳入也建议有具体的营销策略
4、购物篮分析
需求:连带购买各子品类的连带购买订单数,及其连带率
购物篮分析的关键在于如何构建样本,这个样本是什么
以“标签”为例,当我去购买标签的时候,保留包含所有带有标签的订单(购物车),看看其他的产品有多少
是何标签一起购买的
1)基本视图的制作
各子品类的订单数量
关键就在于如何保留特定的订单——样本:标签,需要筛选出所有包含标签的订单
重新思考,将订单和子类别拿出来,然后子类别中只要标签
接下来想在订单上针对订单做筛选,就需要标记出每个带有“标签”的订单,就是要把包含“标签”的订单中的其他的
子类列都设置为1
思路:以订单ID为依据,筛选标签为最大值为1时进行其余值的填充
继续求连带率
由于当前的订单数已经被标签所筛选,所以还得求出其他子类别的订单数
{ FIXED [子类别]:COUNTD([订单 Id])} 求所有子类别的订单数
连带率:包含样本(标签)的全部子类别的订单数 / 所有子类别的订单数
COUNTD([订单 Id])/SUM({ FIXED [子类别]:COUNTD([订单 Id])})
调整可视化对象:
1、调整标签
2、图形
3.创建参数,如果现在计算的不是标签的连带率,是其他的子类别的连带率,怎么办?——参数(X自变量)
5、客户购买力分析
需求:不同地区的客户购买力(以最高交易或者最高订单平均购买力为准)
基础分析
如果要进一步去看销售背后的结构,也就是不同省份的客户的购买力,客户购买力的体现(不同省份,客户的最大
购买金额)的平均值
每个客户可能都有多比交易,要的是每个省份每个客户的最大购买金额,而每个省份的客户数不同所以最后
用平均值
计算:每个省份每个客户的最大销售金额
{ FIXED [省/自治区],[客户名称]:MAX([销售额])}——交易层级(每一行数据)
每个省份每个客户的最大销售金额的平均值
修改上面的公式,max(销售额),将当前的每个客户的最大的交易,改为每个客户最大的订单
MAX({ FIXED [省/自治区],[客户名称],[订单 Id]:SUM([销售额])})
{ FIXED [省/自治区],[客户名称]:MAX({ FIXED [省/自治区],[客户名称],[订单 Id]:SUM([销售额])})
结果:购买力较强的省份是云南、青海、河北等地
建议:
市场细分:了解和识别每个城市的消费者群体和他们的购买习惯
定价策略:根据每个城市的消费水平和购买力,调整你的定价策略
营销和促销活动:购买力强的城市通过高级会员挥动或者限量版吸引消费者,购买力较弱的城市,打折或者
买一送一等
产品组合:强——高端、创新型产品,弱——基础、经济型的产品
服务和体现:强——个性化的服务,弱——快捷
复购日期(第二次复购日期)
6、客户复购分析
1.指标计算
1.st首次订单日期
2.last订单日期
3.F-客户购买频次
4.L-生命周期(月)
5.M-客户贡献金额
6.R-最后购买至今日期
复购日期(第二次复购日期)
复购分析
首次获客日期得到客户数
计算首次和第二次购买的季度数
结论:通过该矩阵发现,2017年早期的时候复购人数更多,2018年以后首次购买人数不断减少
客户留存比率分析
需求:不同获客季度的新客户,在之后的第1、第2、第3.。。。。第N个季度的留存比率(客户数)
各季度首次获客数
复购率计算:32/127 30/127等 用后面每个季度的人数除以最开始的首次客户数
各季度首次购买客户数:
如何改变:使用index函数,在tableau中,就是索引,相当于添加1、2、3、4、5。。。。。。
结果:该超市的复购率较高,3年左右的复购率基本可以维持在40%左右,说明该超市的人群粘性较高
7、RFM客户价值分类分析
R的平均值
F的平均值
M的平均值
比较
RFM标签
IF
[R判断]=1 AND [F判断]=1 AND [M判断]=1 THEN'重要价值客户'
ELSEIF
[R判断]=1 AND [F判断]=0 AND [M判断]=1 THEN'重要发展客户'
ELSEIF
[R判断]=0 AND [F判断]=1 AND [M判断]=1 THEN'重要保持客户'
ELSEIF
[R判断]=0 AND [F判断]=0 AND [M判断]=1 THEN'重要挽留客户'
ELSEIF
[R判断]=1 AND [F判断]=1 AND [M判断]=0 THEN'一般价值客户'
ELSEIF
[R判断]=1 AND [F判断]=0 AND [M判断]=0 THEN'一般发展客户'
ELSEIF
[R判断]=0 AND [F判断]=1 AND [M判断]=0 THEN'一般保持客户'
ELSEIF
[R判断]=0 AND [F判断]=0 AND [M判断]=0 THEN'流失客户'
END