《商务与经济统计》学习笔记（二）---辛普森悖论

最新推荐文章于 2022-04-13 10:29:28 发布

天阑的芋头

最新推荐文章于 2022-04-13 10:29:28 发布

阅读量941

点赞数 1

分类专栏： # 数据分析—统计学知识文章标签：数据分析大数据产品经理

原文链接：http://www.woshipm.com/data-analysis/1061642.html

版权

数据分析—统计学知识专栏收录该内容

13 篇文章 38 订阅

订阅专栏

阅读之前看这里👉：博主是正在学习数据分析的一员，博客记录的是在学习过程中一些总结，也希望和大家一起进步，在记录之时，未免存在很多疏漏和不全，如有问题，还请私聊博主指正。
博客地址：天阑之蓝的博客，学习过程中不免有困难和迷茫，希望大家都能在这学习的过程中肯定自己，超越自己，最终创造自己。

辛普森悖论

定义：辛普森悖论为英国统计学家E.H.辛普森于1951年提出的悖论，即在某个条件下的两组数据，分别讨论时都会满足某种性质，可是一旦合并考虑，却可能导致相反的结论。
常见举例：
一所美国高校的两个学院，分别是：
在这里插入图片描述
法学院和商学院，新学期招生。人们怀疑这两个学院有性别歧视，现作如下统计：

从上图显示的数据我们可以看到，法学院男生的录取比例为8/53=15.1%，女生录取的比例为51/152=33.6%。同理，商学院男生的录取比例为80.1%，女生的录取比例为91.1%。

无论在法学院还是在商学院，女生的录取比例都高于男生，由此可以推断学校在招生时更倾向于招女生吗？
在这里插入图片描述

当计算全校录取情况时，男生录取的比例为209/304=68.8%，女生录取的比例为143/253=56.5%。男生的录取率要高于女生，这下，恐怕要轮到女生感到不公了。

那么问题来了：该大学的招生政策，到底有没有性别歧视？到底是歧视男生还是女生？
先不说结论，我们再来看一个实际工作中会遇到的案例。

某产品的用户中有10000人使用Android设备、5000人使用IOS设备，整体的付费转化率应该是5%。细分发现其中IOS设备的转化率仅为4%，而Android设备则是5.5%。“聪明”的数据分析师得出结论：IOS平台的用户付费转化率低下，建议放弃IOS平台的研发。

一般来说，IOS平板的付费转化率比Android平板高出很多，而IOS手机的转化率也相对更好。这种情况下，设备类型就是复杂变量，如果数据是根据设备类型得到，那么其他的数据就可能被完全忽略。
接下来我们来对比这一组数据：
在这里插入图片描述
由此可见，Android设备转化率无论在平板端还是在手机端的转化率都小于IOS设备，这也很我们的常规预期相符。

当计算全设备情况时，Android的转化比例为550/10000=5.5%，IOS的转化比例只有200/5000=4.0%。这也是题干中“聪明”的数据分析师得出IOS版本应该下线的根源。
原因与应对策略：

误区产生的原因说起来也很简单，就在于将“值与量”两个维度的数据，归纳成了“值”一个维度的数据，并进行了合并。

如果要避免“辛普森悖论”给我们带来的误区，就需要斟酌个别分组的权重，以一定的系数去消除以分组资料基数差异所造成的影响。而在实际转化例子中，就需要用如“ARPU”、“ARPPU”这样看似相似实际上有很大差异的指标来进行分割。

ARPU：每用户平均收入。这个指标计算的是某时间段内平均每个活跃用户为应用创造的收入。如果按天来计算，ARPU就是ARPDAU。
$A R P U = 应用收益 / 应用活跃用户$

ARPU的计算中，所有的用户都被纳入了计算范围——无论是付费用户或非付费用户。ARPU是评估应用变现有效性的指标：ARPU越高，就代表用户在这段时间内为应用带来的变现收入就越多。

ARPU可用于评估应用中的变动是否能有效提升变现收益：如果ARPU提升，证明应用的变动有利于提升应用变现收益；如果ARPU不升反降，应用开发者可能就需要确认一下变动的有效性了。

ARPPU称为每付费用户平均收益。这个指标考核的是某时间段内平均每个付费用户为应用创造的收入。在用户数量上，ARPPU只考虑某一时间段内的付费用户，而非该时间段内所有的活跃用户。
$A R P P U = 应用收益 / 应用付费用户$ 由于分母上数值较小（付费用户<全体活跃用户），对于同一时间的同一应用而言，ARPPU的数值会明显高于ARPU。
ARPPU能够反映付费用户为你的应用带来了多少收益，显示出一个忠诚付费用户实际上愿意支付的金额。同时，这个指标也可以显示用户对一些付费项目的反应。
应用提高收费价格，ARPPU会有一定的提升。但这并不意味着盈利也随之增长，因为涨价往往会让一些无法接受新价格的用户停止付费，导致付费用户规模下降。因此，ARPU与ARPPU两者的关系其实可以这样表达：
$A R P U = A R P P U * 付费用户比例$

在实际应用中，还有一个十分有用的指标：累计ARPU。

如果说ARPU计算的是一个时间段内全部用户产生的应用收益，累计ARPU则聚焦在一定时间段内的某组用户群体对应用产生的收益。

累计ARPU通常以一段时间为计算单位，比如说1天、7天、14天、30天等等。举个例子，ARPU可以用于计算10月1日下载应用的100名用户在30天内平均每人为应用带来了多少收益。

因此，累积ARPU是一个不断增长的数值，因为计算的用户对象数值不变，但是产生的收益却在一直增长。如果应用表现良好，流量购买就发挥效果，累积ARPU的值迟早都会超过CPI（cost per install，单次安装成本）。这就意味着，你买的量开始给你盈利了，ROI从此超过100%。

当时间范围延长，累积ARPU无限接近一个极限值，这就是我们常说的LTV指数了。

同样地，如果要更客观分析产品的运营情况，就需要设立更多角度去综合评判。还是拿上述的设备转化率为例，产品层考虑转化的前提会优先考虑分发量、用户量、运营思路、口碑等等。而往往为了实现最后的转化需要，需要更多前置目标做铺垫。
常用的前置目标：

用户量：免费产品需要很大的用户量才能获得足够的总收入，因为该模式的转化率极低。而这些用户通常来自全球各个地区，使用各种不同类型的设备。针对不同的设备类型，采用通用的平均值是没有意义的。
LTV范围：免费产品需要很长的货币化周期，把用户消费当作玩家是否开心的依据，就像参与度和消费紧密相关一样，因此可以作为分类的标准。

大多数的用户是不会付费的，免费产品的综合付费转化率比较低，是因为把付费玩家和非付费玩家综合到了一起，所以任何对免费用户的衡量都是非常低的。因为大多数的用户是不付费的，所以ARPU以及ARPPU相差很多。

A/B测试中的注意点：

联想到产品运营的实践，一个常见的A/B测试误判例子是这样的：拿1%用户跑了一个重大版本，发现试验版本购买率比对照版本高，就说试验版本更好，我们应该发布试验版本。

而事实上，我们选取的试验组里往往会挑选那些乐于交流、热衷产品、又或者是付费率高粘性高的用户，把他们的数据与全体用户对比是不客观的。当最后发布试验版本时，反而可能降低用户体验，甚至造成用户留存和营收数据的双双下降。

收获与总结

避免辛普森悖论的关键是要同时参考不同用户间的事实全貌。

第一，准确的用户分群在数据分析中是非常重要的，尤其是在免费产品当中，平均用户不仅不存在，而且是误导研发的因素之一，所以关键在于利用特征将用户进行合理划分。

第二，在一个具体的产品中，普适型的数据（如粗暴的对比IOS和Android总体情况）是没有多大参考意义的，一定要细分到具体设备、国家、获取渠道、消费能力等等再进行比对才有价值。

第三，斟酌个别分组的权重，以一定的系数去消除以分组资料基数差异所造成的影响，同时必需了解该情境是否存在其他潜在要因而综合考虑。

作者：数数科技，公众号，数数科技（ThinkingData）
转载微信链接
 转载网址链接

天阑的芋头

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
《商务与经济统计》学习笔记（二）---辛普森悖论

辛普森悖论定义：辛普森悖论为英国统计学家E.H.辛普森于1951年提出的悖论，即在某个条件下的两组数据，分别讨论时都会满足某种性质，可是一旦合并考虑，却可能导致相反的结论。常见举例：一所美国高校的两个学院，分别是：法学院和商学院，新学期招生。人们怀疑这两个学院有性别歧视，现作如下统计：从上图显示的数据我们可以看到，法学院男生的录取比例为8/53=15.1%，女生录取的比例为51/15...
复制链接

扫一扫

专栏目录