Statistics 基础之Hypothesis Tests3---F检验

前言

在之前的两篇文章中,我介绍了t检验和卡方检验,在这篇文章中,我会讲述另一种重要的分布F分布以及与其相关的假设检验方法方差分析(ANOVA),首先我们先来看一下如何定义F分布。

F分布

事实上,F分布与卡方分布有很高的关联性,F统计量可以可以理解为是两个卡方统计量的商,更具体一点,假设随机变量U1符合自由度为v1的卡方分布,随机变量U2符合自由度为v2的卡方分布,那么我们称随机变量F=(U1/v1)/(U2/v2)属于自由度为v1,v2的F分布。这里需要注意的一点是当我们把v1,v2的顺序调换后,得到的F分布的图是不一样的,比如v1=3,v2=8和v1=8,v2=3的F分布是不一样的。

ANOVA

基于F分布的一种最重要的假设检验方法叫做ANOVA,即方差分析,常常用来分析多个总体的均值是否相等等问题。其中ANOVA又分为one-way和two-way,one-way表示只有一个因素影响不同的总体,two-way代表有两个因素共同影响不同的总体。

首先我们需要明确方差分析的假设,
1).方差的同质性:每组样本背后的总体都有相同的方差。
2).每组背后的总体都遵循正态分布。
3).每次抽样均独立。

我们可以将方差分析与t检验相关联,在t检验中,我们主要关注两组样本的均值,而在方差分析中,我们利用方差的思想将其拓展为多组样本的均值检验。

首先给出我们的原假设和备选假设:
null hypothesis: mu_1=mu_2=…
alternative hypothesis: 至少两个组别的均值不等。

然后我们需要去计算特定的统计量的值。
当我们需要对3个及3个以上的总体均值进行比较的时候,我们的F-statistic的表达式为组间平均差异/组内平均差异

具体来说,假设样本组数为m组,每组均有n个数据(这里稍微做了简化,每组的样本数可以不同)。
1.首先我们计算每组的样本的均值,mu_1,mu_2,…mu_m,以及总体的样本均值mu。
2.计算组间差异:SSB= sum{n(mu_i-mu)^2 } for i=1,2,3,…m, 即每组的样本均值与总体均值的差的平方和,权重为每组的样本个数n。
3.计算组内差异:SSI=各组的组内方差的和。
4.计算F=(SSB/m-1)/(SSI/m*n-m)

当我们计算得到对应的F-statistic的值后,我们拿它与查表得到的临界值进行比较,得到假设检验的结论。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值