归因分析中各种指标因子贡献度计算方法总结

目录

1、加法型指标

2、乘法型指标

3、除法型指标

3.1 控制变量法

3.2 综合占比法

3.2.1 方法介绍

3.2.2 举例说明

3.3 综合贡献法

3.3.1 指标拆解的公式推导过程

3.3.2 拆解到倒数第二步结论示例

3.3.3 拆解到最后一步结论示例


在归因分析中,一般我们先分析到底是哪个维度的波动造成了整体的波动,接下来会计算各因子的贡献度。这里如果指标类型不同,所以采用的方法也有所不同。举例来说明,活跃用户数、交易额、点击率这三个指标因为指标类型的不同,在计算因子贡献度时所用的方法也是不一样的,接下来详细看一下。

1、加法型指标

如活跃用户数、浏览用户数这样的指标,看各个因子对整体波动的贡献度

计算公式:贡献度 = 维度值绝对DIFF / 大盘绝对DIFF

举例:活跃用户数

2、乘法型指标

如GMV = 用户数 * 人均单量 * 均价,需分析是用户数、人均单量 、均价这三者哪个指标的变动对整体的贡献度大

计算公式:

举例:GMV

3、除法型指标

如点击率、成功率、人均单量、人均浏览次数这样的指标,分析各因子对整体波动的贡献度,这里需要考虑是指标变化还是分母结构变化带来的影响

除法指标的计算稍微复杂一些,主要的方法有以下三种,其中控制变量法计算起来复杂且无法保证各因子变动贡献值之和等于指标本身波动,因此不是很推荐。剩下的综合占比法(自己起的名字)综合贡献法这两种方法的得到的贡献值满足可加且等于整体指标变化,易于理解和解释,较推荐。

3.1 控制变量法

该方法假设只有当前因子的分子分母变化,其他因子的指标不变化,计算最终的指标是多少,然后计算这个指标变动占整体波动的比例是多少,得到该因子贡献度,但这个贡献度加起来可能不等于100%,所以不是很推荐。

3.2 综合占比法

3.2.1 方法介绍

这个是自己起的名字,是看到蚂蚁金服的一篇文章中的方法,来源文章放到最后的参考资料里。该方法的核心思路如下:计算各因子贡献值时,将因子指标变化转化为占整体的比例,从而计算贡献度,较为抽象,这里贴一下蚂蚁金服中的例子。

3.2.2 举例说明

如下数据是各用户类型在活动前后的占比和购买率数据,整体的购买率从18.44%下降到16.79%,但从各用户类型来看购买率都是上升的,也就是出现了辛普森悖论(详细看数据可以发现,主要是因为活动前后用户群体的结构发生了较大的变化,新用户的占比从16%上升到34%,活跃用户的占比从52%下降到41%)分析一下各群体对整体购买率下降的贡献度是多少,下面是用该方法的计算过程和计算结果。

得到的结论是:整体指标下降了-1.7%,新用户对指标下降的贡献是-86%,沉默用户的贡献度是44%,活跃用户的贡献度是142%。也就是该方法认为新用户的购买率从活动前的6%上升到7%,带来的是整体指标的上升,这个贡献度是86%;活跃用户和沉默用户造成了整体指标的下降,贡献率分别为142%和44%。

该方法的优点是:各因子的贡献度加和等于100%,能够较好进行业务解释。缺点是没有量化指标波动和结构变动的贡献。

3.3 综合贡献法

核心思路是将指标变化通过一些列恒等公式的变化转化为指标变化(组内变化)、结构变化(即分母分布变化,也叫组间变化)、交叉项变化,这样就能够对指标变化做出更全面的解释。

3.3.1 指标拆解的公式推导过程

首先有如下前提,下标i代表各个因子,r_{i}^{0}为基期各因子指标,r_{i}^{1}为当期各因子指标,p_{i}^{0}为基期各因子的占比,p_{i}^{1}为当期各因子占比,那么:

基期指标:r^{0} = \sum_{i}r_{i}^{0}\times p_{i}^{0}

当期指标:r^{1} = \sum_{i}r_{i}^{1}\times p_{i}^{1}

指标变化:\Delta r_{i} = r_{i}^{1} - r_{i}^{0}

分母占比变化:\Delta p_{i} = p_{i}^{1} - p_{i}^{0}

分母占比变化恒等式:\sum \Delta p_{i} =\sum_{i}( p_{i}^{1} - p_{i}^{0}) = \sum_{i} p_{i}^{1} - \sum_{i} p_{i}^{0} = 0

指标变化拆解:

\begin{aligned} \Delta r &= r^{1} - r^{0} \\ &= \sum_{i}( r_{i}^{1}\times p_{i}^{1} - r_{i}^{0}\times p_{i}^{0}) \\ &= \sum_{i}( r_{i}^{1}\times p_{i}^{1} - r_{i}^{0}\times p_{i}^{0} + r_{i}^{0}\times p_{i}^{1} - r_{i}^{0}\times p_{i}^{1}) \\ &= \sum_{i}(r_{i}^{1}\times p_{i}^{1} - r_{i}^{0}\times p_{i}^{1} + r_{i}^{0}\times p_{i}^{1} - r_{i}^{0}\times p_{i}^{0}) \\ &= \sum_{i}(\Delta r_{i}\times p_{i}^{1} + r_{i}^{0}\times \Delta p_{i}) \\ &= \sum_{i}(\Delta r_{i}\times (p_{i}^{0} + \Delta p_{i}) + r_{i}^{0}\times \Delta p_{i}) \\ &= \sum_{i}(\Delta r_{i}\times p_{i}^{0} + \Delta r_{i}\times \Delta p_{i} + r_{i}^{0}\times \Delta p_{i}) \\ &= \sum_{i}(\Delta r_{i}\times p_{i}^{0} + \Delta r_{i}\times \Delta p_{i} + (r_{i}^{0} - r_{0})\times \Delta p_{i}) \end{aligned}

公式拆解到倒数第二步时,很容易理解,到最后一步时,把最后一项 r_{i}^{0}\times \Delta p_{i} 转化为 (r_{i}^{0} - r_{0})\times \Delta p_{i} 实际上是做了一个恒等变化,多减了一个基期指标 r_{0}(常数) ,因为\sum \Delta p_{i} = 0,这个常数 乘以\sum \Delta p_{i} 还为0。这里会有一个问题,拆到倒数第二步和最后一步计算出来的结果是否有区别,如果有区别那个的解释力更强一些。为了回答这个问题,接下来就用上边那份数据来看一下两个拆解方法的计算结果。

3.3.2 拆解到倒数第二步结论示例

可以发现这个结论和上边的综合占比法的结论是一样的。

3.3.3 拆解到最后一步结论示例

得到的结论是:整体指标下降了-1.7%,新用户和活跃对指标下降的贡献是正,也就是新用户是造成了整体指标的下降,贡献率为115%,其次是活跃用户为19%;而沉默用户对整体指标的下降贡献是负,也就是有提升作用的,可以发现和上边的结论差异较大。

可以这样理解,新用户由于活动后的占比大幅上升,占比从16%上升到了34%,购买率虽然从6%上升到了7%,但是和活动前整体的购买率18%相比低的较多,所以拉低了整体的购率率,同理活跃用户由于占比下降较多11%,但购买率上升不高,所以也拉低的整体的购买率。在计算整体的贡献度时该方法较上边方法多考虑了相较于整体指标各因子的差异。

同时该方法可以得到指标变化的贡献度和结构变化的贡献度,能够获得的信息更多,并且解释力也更强,相对来讲较为推荐。

参考资料:

归因分析计算因子贡献度常见的方法-CSDN博客

蚂蚁金服异常检测和归因诊断分析实践

『指标异动』贡献度定量归因之法,带你知因又知果!

  • 13
    点赞
  • 51
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值