有各组方差怎么算组间平方和_统计基础 | 方差分析的基本思想

文章授权转载 | 医学统计分析精粹

文章作者 | 法晓

T检验相比,方差分析其实就是从另一个角度看数据。 那么,它是怎么看的呢? ~~且待本文分解。 从1918年费歇尔创造了方差分析,到现在快过一百岁生日了。 下图是最新一期的nature genetics,最生猛的文章,也离不开这个方差分析啊。 0469bad35a496470a90bbdec7714d8e9.png 我们说方差分析,这个方差,实际上就是变异的意思。 一词多义,至少老外的字典里是这样的。 c23661380c5830eb0c7ce5c7985599d6.png 数据的变异,大家都该了解的。 我们方差分析,就是对这个方差,或者这个数据的变异进行分析。 很简单,变异可以分为哪几部分,这几部分之间什么关系? 解决了这两个问题,就解决了方差分析。 cf1f01df70cae531cb41f566ae2bfd44.png b8dd76c27ff2052be4abc3acc19f98ea.png 试想一下,上面这组数据,分成六个亚组时,每组各自的变异情况是什么样的? 把六组数据合到一起,变异情况又是什么样的? 有了上一段变异的思想,我们继续来看一下变异的分解: 3e8d8c347cab45d3fa8ce5f67f4a59a2.png 很简单,把变异分为组内变异和组间变异两部分即可。 下图中以数据点为例,展示了何为组内变异和组间变异: a6f9ddbcce544f97a78f2e396b3d7cb8.png A、B分别代表的内容理解了之后,我们看一下其在下图中的对比。 直观来看(先做一个假定),左图各组样本均数不相同,而右图则较为一致。 那我们再看下其两类变异: 左图中组间差异很大,右图中组间差异很小(B)。 相对来说,左图中组内差异较小,而右图中组内差异较大(A)。 5c58cb60fc4996f45e9af2887ed2e84e.png 这说明了什么问题呢? 可不可以看出来, 如果组间差异(B)远大于组内差异(A),就意味着各组样本均数不一致呢? 是的,方差分析就是基于这样的思路: 以组内差异(A)为参考基准,考察组间差异(B)的大小。 如果组间差异(B)远大于组内差异(A),则认为组间存在区别。 而组内差异,我们认为是因为(完全)随机而产生的。以这样一个完全随机的尺度作为标杆,也甚是巧妙。 e729fb3ea5c09715510e63a69cd37c9a.png 上图重新对组内、组间差异(A、B)进行了定义(上文中的A、B实际上并不是严格意义上的方差变异)。 同时,我们也引出了F值,即B比A的值。 5d2c12b9fff7e491524a4cb01520c725.png 537520e69319b3d9321dc32b370b68d2.png 基于F分布,就很容易看出,当组间差异越大(横坐标越向右),越容易进入我们拒绝原假设(H0,各组均数相同)的区域。 一般教材上习惯这样定义方差分析的基本思想: 0ef169fedba4813f8db11925f7efe786.png 你理解了吗? 本文撰写匆忙,就到这里了啦 126072bbc7970531d6217b4cfe6691cf.png
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值