χ² 分布到 F 分布到 ANOVA

1. χ²分布

2. F分布

当需要计算方差的比值时,便会用到 F分布。

如下两个独立的分布:

  • U1:χ²分布,自由度为 ν1
  • U2:χ²分布,自由度为 ν2

F-分布的概率密度函数为:

f ( x ) = Γ ( ν 1 + ν 2 2 ) ( ν 1 ν 2 ) ν 1 2 x ν 1 2 − 1 Γ ( ν 1 2 ) Γ ( ν 2 2 ) ( 1 + ν 1 ν 2 x ) ν 1 + ν 2 2 , x ≥ 0 f(x)=\frac{\Gamma(\frac{\nu_1+\nu_2}{2})\left(\frac{\nu_1}{\nu_2}\right)^{\frac{\nu_1}{2}}x^{\frac{\nu_1}{2}-1}}{\Gamma(\frac{\nu_1}2)\Gamma(\frac{\nu_2}2)(1+\frac{\nu_1}{\nu_2}x)^{\frac{\nu_1+\nu_2}2}}, \quad x\ge 0 f(x)=Γ(2ν1)Γ(2ν2)(1+ν2ν1x)2ν1+ν2Γ(2ν1+ν2)(ν2ν1)2ν1x2ν11,x0

F-分布的数字特征:

  • 均值: μ = ν 2 ν 2 − 2 , ν 2 > 2 \mu=\frac{\nu_2}{\nu_2-2}, \quad \nu_2\gt 2 μ=ν22ν2,ν2>2
  • 中位数:当 ν 1 = ν 2 \nu_1=\nu_2 ν1=ν2 时,中位数为 1;
from scipy.stats import f
import matplotlib.pyplot as plt

x = np.arange(0, 10, .001)
plt.plot(x, f.pdf(x, 3, 8), x, f.pdf(x, 8, 3), x, f.pdf(x, 20, 20))
plt.legend(['3 & 8 df', '8 & 3 df', '20 & 20 df'])

在这里插入图片描述

3. ANOVA

如果计算得到的 F-ratio 或者叫 F-score < critical value(临界值),也即落在绿色区域,则 fail to reject null hypothesis(不能拒绝0假设),反之 F-score > critical value,落在红色区域(rejection region),则 reject null hypothesis(拒绝0假设)。

某已知自由度的 F分布,其 critical value 通过查表得到:

在这里插入图片描述

表中红色阴影表示 0.05 的置信水平对应的临界值;
表中黑体数字则在 0.01 的置信水平下对应的临界值;

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

五道口纳什

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值