python 显著性差异_Python数据分析基础|方差分析

本文介绍了Python中的方差分析,包括单因素、多因素和析因方差分析,通过实例展示了如何利用statsmodels库进行方差分析,以判断不同因子水平下反应变量的均值差异是否显著。
摘要由CSDN通过智能技术生成

之前我们曾经讲过用Python做t检验,它用于分析一组数据与另一组数据或者总体均值之间的均值差异,从而判断它们是否来自于同一个总体。我会分享大量关于网页抓取、数据分析与挖掘、机器学习还有可视化等方面的知识,欢迎感兴趣的同学关注我!

但是t检验有它的局限性,它无法应对多个因子变量以及因子变量有多个水平(大于2)的情况。这时,我们就需要使用方差分析了。

方差分析的目的是分析因子对反应变量有无显著影响,即因子的不同水平下反应变量(因变量)的均值是否有差异。

一些概念

在方差分析中,我们需要注意几个概念:组内偏差平方和,即误差平方和,ESS:它反映了样本与其所处因子水平的组别均值的偏差,比如有三个班级ABC,小明是A班的学生,那么小明的成绩与A班成绩的均值之间的差异就是组内差异。

组间差异平方和,又称因子平方和,FSS:它反映了不同因子水平间的均值差异,比如上述的三个班级,A、B、C三个班级的均值之间的差异就叫组间差异。

(总)离差平方和,TSS:组内差异与组间差异加起来,就是总的离差了。

组间均方差和组内均方差:方差除以自由度就是均方差。

我们的φ统计量就是组间均方差和组内均方差的均值,它符合F分布。φ统计量越大,就说明组间差异对于总离差的贡献越大,当超过了一定水平之后,我们就认为因子影响显著,即不同水平间存在显著差异。

基本步骤根据感兴趣的因素的不同取值,将反应变量分成M个组;

提出原假设H0

因子对于反应变量没有影响;备择假设H1

因子对观测变量有

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值