假设检验知识总结

假设检验知识总结

假设检验的逻辑是什么?

从知乎上比较好的回答中可以总结出,
假设检验的基本逻辑是:

  1. 不轻易拒绝假设
  2. 小概率事件发生不正常

结合这两点,我们设置一个随机变量的区域,这个区域是偏离原假设的,并且发生在这个区域的概率很小,如果实际观察到的值还是出现在这个不太可能出现的范围内,则我们可以拒绝原假设

其中,区域对应的是临界值,发生在这个临界区间的概率称为显著性水平。

有两种方法可以决定是否拒绝原假设:

  • 给定发生偏离原假设极端情况的概率(即显著性水平 α \alpha α),可以计算得到对应的临界值(参考下图,偏离原假设的阴影部分面积表示显著性水平,对应的坐标表示临界值)。
    若观察值在临界值范围内,表示出现这种现象是正常的,则可以接受原假设;若观察值超过临界值范围,,则表示在原假设下出现了不太可能的现象,则我们拒绝原假设

  • 给定发生偏离原假设极端情况的概率,计算出现观察值以及比观察值还要偏离原假设的概率(这就是p值),若 p > α p>\alpha p>α,则表示观察值在临界值范围内,可以接受原假设(图1);若 p < α p < \alpha p<α,则表示观察值在临界值范围之外,拒绝原假设(如图2)

在这里插入图片描述

假设检验的原理

假设检验的基本概念

还是以射箭的例子来解释假设检验的一些基本概念:

  1. 零假设(null hypothesis):说白了就是你想证伪的假设,在射箭的例子里,就是我在吹牛皮,我的平均水平不是8环,记为 H 0 : μ = 8 H_0: \mu = 8 H0:μ=8

  2. 备择假设:是一种与原假设相反的关于总体的断言,在射箭的例子里,可能的备择假设有:

H 1 : μ ≠ 8 H_1:\mu \neq 8 H1:μ=8(即平均水平不是8环,对应双尾检验)

H 1 : μ > 8 H_1:\mu > 8 H1:μ>8(即平均水平大于8环,你还谦虚了,对应右尾检验)

H 1 : μ < 8 H_1:\mu < 8 H1:μ<8(即平均水平小于8环,你在吹牛,对应左尾检验)

从里面选择一个作为备择假设,一般来说,我们将希望证伪的假设作为原假设,希望予以支持的作为备择假设。所以,这里,我们选择你在吹牛作为备择假设,即 H 1 : μ < 8 H_1:\mu < 8 H1:μ<8

  1. 检验统计量:为了进行假设检验,我们从总体中随机抽取样本,计算相关统计量,该统计量随着假设检验的类型不同而不同,但要求在零假设下的分布必须是已知的(或假设的)(比如假设我的射箭靶数服从高斯分布)
  • p p p: 检验的 p p p值是零假设下,得到检验统计量或比样本值更极端的值的概率, p p p越小,就代表零假设成立的概率越小(为什么?因为 p p p值代表的是在零假设下出现比观察值更极端的概率,比如我射击出了2环,但 p p p值显示出现比2环更极端的概率非常低,但现在却出现了,说明假设可能不靠谱)
  • α \alpha α:显著性水平 α \alpha α是检验的一个阈值, α \alpha α的值必须在假设检验前确定好,例如0.05。然后比较 p p p α \alpha α
    • 如果一个检验的 p < α p < \alpha p<α,检验拒绝零假设
    • 如果 p > α p > \alpha p>α,则没有足够的证据拒绝零假设
  • 置信区间: 假设检验的结果用置信区间来表示。置信区间是一个估计值范围,其上界和下界是根据样本值和样本已知的抽样分布计算的。比如我们计算出我射箭的置信区间为 5 ∼ 7 5 \sim 7 57环,则可以拒绝零假设
  • 自由度: 某个统计量的计算方法中,允许变化的值(样本)的个数,本质上,自由度是做一个估计时,所拥有的独立信息(证据)的数量
假设检验步骤
  1. 提出 H 0 H_0 H0 H 1 H_1 H1
  2. 设定显著性水平 α \alpha α
  3. 选定统计方法,将样本观察值按照公式计算出统计量大小
  4. 根据统计量的大小及其分布确定检验假设成立的可能性 p p p的大小,若 p > α p > \alpha p>α,结论为按所取显著性水平 α \alpha α不显著,无充足理由拒绝 H 0 H_0 H0,若 p < α p < \alpha p<α,结论为显著,拒绝 H 0 H_0 H0
假设检验的分类

假设检验分为三种

  1. 分布检验,如Anderson-Darling和单样本Kolmogorov-Smirnov用于检验样本数据是否来自具体特定分布的总体
  2. 定位检验,如z检验和单样本t检验,用于检验样本数据是否来自具有特定均值或中值的总体
  3. 离散度检验,如卡方检验,用于检验样本数据是否来自具有特定方差的总体

方差分析(ANOVA)

方差分析又称为 F F F检验,是一种判定方差在类间和类内是否(明显)具有区别的一种方法。如果类内差异相对于类间差异较小,则可以推断出类与类之间是有明显差异的。

1-way ANOVA的基本思想

F F F检验的零假设为所有类的均值都相等,备择假设是所有类的均值不全相等(即至少有一个类的均值与其他具有显著差异)

ANOVA的核心思想可以用一句话总结:“所有样本的总差异可以分解为类间差异和类内差异”。

∑ i ∑ j ( y i j − y ˉ ) 2 ⏟ S S T = ∑ j n j ( y ˉ j − y ˉ ) 2 ⏟ S S R + ∑ i ∑ j ( y i j − y ˉ j ) 2 ⏟ S S E \underbrace{\sum_{i}\sum_{j}(y_{ij}-\bar y)^2}_{SST} = \underbrace{\sum_j n_j(\bar y_j - \bar y)^2}_{SSR} + \underbrace{\sum_i \sum_j (y_{ij} - \bar y_j)^2}_{SSE} SST ij(yijyˉ)2=SSR jnj(yˉjyˉ)2+SSE ij(yijyˉj)2

设总样本数为 N N N,类别数为 k k k( k ≥ 2 k \ge 2 k2),则

  1. 总差异(SST): 所有样本与总体均值的差异
  2. 类间差异(SSR): 类均值与总体均值的差异,类间差异的自由度为 k − 1 k-1 k1,故类间差异的均方为 S S R k − 1 \frac{SSR}{k-1} k1SSR
  3. 类内差异(SSE): 类内每个样本与其所在类均值的差异,类内差异的自由度为 N − k N-k Nk,因此类内差异的均方为 S S E N − k \frac{SSE}{N-k} NkSSE

MSR和MSE的比值,就是 F F F统计量。理论证明,当 H 0 H_0 H0成立时, F F F统计量服从对应自由度分别为 k − 1 , N − k k-1,N-k k1,Nk F F F分布, F F F值越接近1,就越没有理由拒绝 H 0 H_0 H0,反之, F F F值越大,拒绝 H 0 H_0 H0的理由就越充分

F = S S R k − 1 S S E N − k = M S R M S E ∼ F k − 1 , N − k F = \frac{\frac{SSR}{k-1}}{\frac{SSE}{N-k}} = \frac{MSR}{MSE} \sim F_{k-1, N-k} F=NkSSEk1SSR=MSEMSRFk1,Nk

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值