方差分析 概述

方差分析是基于F检测的。

首先说说简单的单因素方差分析,所谓单因素举个例子就是判断男生女生的身高是不是来自同一个总体,换句话说就是性别这个因素会不会影响到身高的分布。这里只考虑一个因素就是性别。而男或者女就是所谓的“水平”。可以在不同的水平下收集数据。

单因素方差分析的原假设是在不同的水平下的总体的均值是相等的。然后将所有样本的总变差拆分成各个水平下样本的误差SE 加上 各个水平上均值间的因素效应误差SA。可以证明SE 和 SA 分别服从两个自由度不同的卡方分布。于是F检测就可以登场了。

同样根据上面的男女生身高来举例:

身高(cm)

男: 175     180     176

女:    165    167      162


对于上面的这组数据你可以统计3个方差: 一个是全部六个数据的总平方差(254), 一个每个性别水平下的总平方差(男:14,女:12.6666), 和男生平均身高与女生平均身高间的方差(76.05514)

你会发现254.8333=14+12.6666+76.05514*3


用一段R来表述就是(注意R取方差用的除数是n-1,所以这里求变差的时候都是用的2而不是3):

hm=c(175,180,176)
hw=c(165,162,167)
h=c(hm,hw)
var(hm)*2+var(hw)*2+3*((mean(hm)-mean(h))^2+(mean(hw)-mean(h))^2)-var(h)*5
round(.Last.value)

SASE分别服从自由度为s − 1,n − sχ2分布

F=\frac{(S_A)/(s-1)}{(S_E)/(n-s)}=\frac{\frac{S_A}{\sigma^2}/(s-1)}{\frac{S_E}{\sigma^2}/(n-s)} \sim  F(s-1,n-s)


F服从卡方分布, 计算出F就能查表知道H0成立的可能性了.


详见维基百科:

点击打开链接


另有一篇R使用anova函数来做单因素方差分析的教程:

http://jingyan.baidu.com/article/4b07be3c4e314548b380f3a5.html


再来说说多因素的方差分析:待续

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱知菜

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值