统计学:辛普森悖论

解释

这是一种统计现象,指的是在两个组别中存在某一趋势,但在整体内却呈现相反趋势。

示例

示例1:学院男女录取率

两个学院,男性录取率均高于女性,可整体上女性的录取率高于男性。
在这里插入图片描述

示例2:结石治愈率

总体上看,B疗法优于A疗法,细分病例,发现A疗法优于B疗法。
从抽样数据上看,B疗法在大结石上运用得多,A疗法在小结石上运用得多,样本流量分配不均。分析背后原因可能是医生选择治疗方法时有倾向性。
在这里插入图片描述

为什么会出现辛普森悖论?

样本流量分配不均衡。

如何避免出现辛普森悖论?

科学分配流量+分层互拆和定向实验设计+多维分析
1.科学分配流量:注意分组的随机性,关注两组样本的核心特征上关键指标是否一致。
2.分层互拆和定向实验设计:同一实验对不同的用户有不同的结果,因此将潜在变量放在同一分层或进行互斥实验,不让潜在变量影响检验的实验变量。(比如适老化版本对年轻用户、老年用户产生不同影响,可以将人群拆分进行定向实验)
3.多维度分析:除了拆解整体,也拆分维度数据

实际运用

1.某款产品迭代留存率下降70%,是否意味着迭代版本不好?
不一定,整体数据呈现下降趋势,但对于分组后可能呈现不同的趋势。
可以采取的策略:
1.分组分析:将用户按不同特征分组,比如新老、渠道来源、地区等,分别计算每个组的留存率
2.识别潜在变量:分析影响留存的潜在变量,比如用户行为、产品使用频率、用户满意度等。
3.多维度评估迭代效果:不单从留存率下降就判断迭代版本不好,需要综合多个维度分析留存率下降的原因。通过更细致、合理的统计方法,更准确地评估效果。(比如用户反馈跟调研、A/B测试、多变量回归分析、因果关系分析)

  • 9
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值