统计学习笔记:假设检验基本概念及U检验、T检验、F检验

1. 假设检验

这里只讨论双侧参数假设检验,不包含单侧及非参的假设检验。

原假设和备择假设

在参数假设检验中,总体的分布类型已知,假设检验的目的是对总体参数进行检验,为此,研究者需要事先提出某个假设,才能根据样本统计量判断假设是否真实。在参数假设检验中,“假设”是对总体参数的具体数值所作的陈述。为了使得作为证据的样本统计量必然支持且仅支持一个假设,要建立对于总体参数在逻辑上完备互斥的一对假设,即原假设(null hypothesis,记为 H 0 H_0 H0),备择假设(alternative hypothesis,记为 H 1 H_1 H1)。
原假设(又称零假设),是假定总体参数未发生变化;备择假设(又称对立假设),是假定总体参数发生变化。实际建立假设时,原假设与备择假设方向不同,会导致不同的结论,为此,在选择原假设和备择假设时,我们通常根据研究者是希望收集证据予以支持还是拒绝的判断作为选择依据。通常将研究者希望收集证据予以拒绝的假设作为原假设,而将研究者希望通过搜集证据予以支持的假设作为备择假设。
例如某产品质量标准为100g,我们想验证某一批产品是否合格,研究者通常想找出不合格产品,所以 H 0 : μ = 100 H_0: \mu=100 H0:μ=100 H 1 : μ ≠ 100 H_1: \mu\neq100 H1:μ=100

第一类错误和第二类错误

第一类错误:原假设是正确的,却拒绝了原假设。
第二类错误:原假设是错误的,却没有拒绝原假设。
我们分别称之为拒真和纳伪。

决策H0为真H1为真
接受H0正确Type2
拒绝H0Type1正确

我们想要在检验中尽可能地使两种错误概率同时减小,但实际上两种错误概率无法同时优化,除非提高样本量。所以通常的做法就是仅限制第一类错误的概率,为其找到一个阈值 α \alpha α,称之为显著性水平。

p值

在假设检验中我们做出判断有两种方式:

  1. 计算检验统计量,与临界值比较,如U检验中的 U ( X ) U(X) U(X) u α / 2 u_{\alpha/2} uα/2比较
  2. 计算p值,与显著水平 α \alpha α进行比较

p值计算方式:
用Z表示检验的统计量,ZC表示根据样本数据计算得到的检验统计量值
以双侧检验U检验为例, x 0 x_0 x0为样本数据
H 0 : μ = μ 0 H_0: \mu=\mu_0 H0:μ=μ0 H 1 : μ ≠ μ 0 H_1: \mu\neq\mu_0 H1:μ=μ0
p v a l u e = P H 0 ( ∣ U ( X ) ∣ > U ( x 0 ) ) pvalue=P_{H_0}(|U(X)|>U(x_0)) pvalue=PH0(U(X)>U(x0))

2. U检验

U检验又称Z检验,U检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法(总体的方差已知)。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。

单样本U检验

  • 假设: H 0 : μ = μ 0 H_0: \mu=\mu_0 H0:μ=μ0 H 1 : μ ≠ μ 0 H_1: \mu\neq\mu_0 H1:μ=μ0
  • 检验统计量: U ( X ) = n ( X ‾ − μ 0 ) σ 0 U(X)=\frac{\sqrt n(\overline{X}-\mu_0)}{\sigma_0} U(X)=σ0n (Xμ0)
  • 拒绝域: { x : ∣ U ( x ) ∣ > u α / 2 } \{x:|U(x)|>u_{\alpha/2}\} {x:U(x)>uα/2}

推导:
X ‾ ∼ N ( μ , σ 0 2 n ) \overline{X}\sim N(\mu,\frac{\sigma_0^2}{n}) XN(μ,nσ02),得到 n ( X ‾ − μ ) σ ∼ N ( 0 , 1 ) \frac{\sqrt n(\overline{X}-\mu)}{\sigma}\sim N(0,1) σn (Xμ)N(0,1)。第一类错误概率 P H 0 ( ∣ n ( X ‾ − μ ) σ 0 ∣ > c ) ≤ α P_{H_0}(|\frac{\sqrt n(\overline{X}-\mu)}{\sigma_0}|>c)\leq \alpha PH0(σ0n (Xμ)>c)α,所以 c = u α / 2 c=u_{\alpha/2} c=uα/2,当 ∣ U ( x ) ∣ > u α / 2 |U(x)|>u_{\alpha/2} U(x)>uα/2时拒绝原假设。

双样本U检验

  • 假设: H 0 : μ 1 = μ 2 H_0: \mu_1=\mu_2 H0:μ1=μ2 H 1 : μ 1 ≠ μ 2 H_1: \mu_1\neq\mu_2 H1:μ1=μ2
  • 检验统计量: U = ( X 1 ‾ − X 2 ‾ ) σ 1 2 n 1 + σ 2 2 n 2 U=\frac{(\overline{X_1}-\overline{X_2})}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} U=n1σ12+n2σ22 (X1X2)
  • 拒绝域: { x : ∣ U ∣ > u α / 2 } \{x:|U|>u_{\alpha/2}\} {x:U>uα/2}

推导:
X 1 ‾ ∼ N ( μ 1 , σ 1 2 n 1 ) \overline{X_1}\sim N(\mu_1,\frac{\sigma_1^2}{n_1}) X1N(μ1,n1σ12) X 1 ‾ ∼ N ( μ 2 , σ 2 2 n 2 ) \overline{X_1}\sim N(\mu_2,\frac{\sigma_2^2}{n_2}) X1N(μ2,n2σ22),所以 X 1 ‾ − X 2 ‾ ∼ N ( μ 1 − μ 2 , σ 1 2 n 1 + σ 2 2 n 2 ) \overline{X_1}-\overline{X_2}\sim N(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}) X1X2N(μ1μ2,n1σ12+n2σ22),得到 X 1 ‾ − X 2 ‾ − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) \frac{\overline{X_1}-\overline{X_2}-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) n1σ12+n2σ22 X1X2(μ1μ2)N(0,1)。第一类错误概率 P H 0 ( ∣ ( X 1 ‾ − X 2 ‾ ) σ 1 2 n 1 + σ 2 2 n 2 ∣ > c ) ≤ α P_{H_0}(|\frac{(\overline{X_1}-\overline{X_2})}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}|>c)\leq \alpha PH0(n1σ12+n2σ22 (X1X2)>c)α,所以 c = u α / 2 c=u_{\alpha/2} c=uα/2,当 ∣ U ∣ > u α / 2 |U|>u_{\alpha/2} U>uα/2时拒绝原假设。

3. T检验

T检验又称student t检验,T检验是一般用于小样本(即样本容量小于30)平均值差异性检验的方法(总体的方差未知)。所以T分布中用样本方差 S n 2 S_n^2 Sn2作为总体方差 σ 2 \sigma^2 σ2一个点估计进行计算。

单样本T检验

  • 假设: H 0 : μ = μ 0 H_0: \mu=\mu_0 H0:μ=μ0 H 1 : μ ≠ μ 0 H_1: \mu\neq\mu_0 H1:μ=μ0
  • 检验统计量: T ( X ) = n ( X ‾ − μ 0 ) S n T(X)=\frac{\sqrt n(\overline{X}-\mu_0)}{S_n} T(X)=Snn (Xμ0)
  • 拒绝域: { x : ∣ T ( x ) ∣ > t α / 2 ( n − 1 ) } \{x:|T(x)|>t_{\alpha/2}(n-1)\} {x:T(x)>tα/2(n1)}

推导:
首先引入一个定理, X 1 , . . . , X n ∼ i i d N ( μ , σ 2 ) X_1,...,X_n\sim_{iid}N(\mu,\sigma^2) X1,...,XniidN(μ,σ2) S n 2 = 1 n − 1 ∑ i = 1 n ( X − X ‾ ) 2 S_n^2=\frac{1}{n-1}\sum_{i=1}^{n}(X-\overline{X})^2 Sn2=n11i=1n(XX)2为样本方差,则

  • X ‾ ∼ N ( μ , σ 2 n ) \overline X\sim N(\mu,\frac{\sigma^2}{n}) XN(μ,nσ2)
  • ( n − 1 ) S n 2 / σ 2 ∼ X 2 ( n − 1 ) (n-1)S_n^2/\sigma^2\sim \mathcal{X}^2(n-1) (n1)Sn2/σ2X2(n1)

根据t分布的定义: T = ξ η / n T=\frac{\xi}{\sqrt{\eta/n}} T=η/n ξ,其中 ξ ∼ N ( 0 , 1 ) \xi\sim N(0,1) ξN(0,1) η ∼ X 2 ( n ) \eta\sim\mathcal{X}^2(n) ηX2(n),则记为 T ∼ t ( n ) T\sim t(n) Tt(n)
所以检验统计量 T ( X ) = n ( X ‾ − μ 0 ) S n T(X)=\frac{\sqrt n(\overline{X}-\mu_0)}{S_n} T(X)=Snn (Xμ0)是满足 t ( n − 1 ) t(n-1) t(n1)分布的,在 ∣ T ( x ) ∣ > t α / 2 ( n − 1 ) |T(x)|>t_{\alpha/2}(n-1) T(x)>tα/2(n1)情况下拒绝原假设。

双样本T检验( σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2未知时)

  • 假设: H 0 : μ 1 = μ 2 H_0: \mu_1=\mu_2 H0:μ1=μ2 H 1 : μ 1 ≠ μ 2 H_1: \mu_1\neq\mu_2 H1:μ1=μ2
  • 检验统计量: T = ( X ‾ − Y ‾ [ σ ( m + n ) / ( m n ) ] ) ( m + n − 2 ) S m n ∗ 2 / [ σ 2 ( m + n − 2 ) ] = m n m + n X ‾ − Y ‾ S m n ∗ 2 T=\frac{(\overline{X}-\overline{Y}[\sigma\sqrt{(m+n)/(mn)}])}{\sqrt{(m+n-2)S_{mn}^{*2}/[\sigma^2(m+n-2)]}}=\sqrt{\frac{mn}{m+n}}\frac{\overline{X}-\overline{Y}}{S_{mn}^{*2}} T=(m+n2)Smn2/[σ2(m+n2)] (XY[σ(m+n)/(mn) ])=m+nmn Smn2XY
  • 拒绝域: { x : ∣ T ∣ > t α / 2 ( n − 1 ) } \{x:|T|>t_{\alpha/2}(n-1)\} {x:T>tα/2(n1)}

推导:
总样本方差 S m n ∗ 2 = ∑ i = 1 m ( X i − X ‾ ) 2 + ∑ i = 1 m ( Y i − Y ‾ ) 2 m + n − 2 S_{mn}^{*2}=\frac{\sum_{i=1}^m(X_i-\overline X)^2+\sum_{i=1}^m(Y_i-\overline Y)^2}{m+n-2} Smn2=m+n2i=1m(XiX)2+i=1m(YiY)2,在 H 0 H_0 H0成立时, ( m + n − 2 ) S m n ∗ 2 ∼ X 2 ( m + n − 2 ) (m+n-2)S_{mn}^{*2}\sim \mathcal{X}^2(m+n-2) (m+n2)Smn2X2(m+n2),所以 T ∼ t ( m + n − 2 ) T\sim t(m+n-2) Tt(m+n2) ∣ T ∣ > t α / 2 ( n − 1 ) |T|>t_{\alpha/2}(n-1) T>tα/2(n1)时拒绝原假设。

3. F检验

不同的前面的内容,F检验的内容更多也更复杂,先看一下百科上的介绍:

F检验(F-test),最常用的别名叫做联合假设检验(英语:joint hypotheses
test),此外也称方差比率检验、方差齐性检验。它是一种在零假设(null hypothesis,
H0)之下,统计值服从F-分布的检验。其通常是用来分析用了超过一个参数的统计模型,以判断该模型中的全部或一部分参数是否适合用来估计母体。

在实际应用中F检验有如下用途:

  • 方差齐性检验(F-test of equality of variances)
  • 方差分析(Analysis of Variance, ANOVA)
  • 线性回归方程整体的显著性检验

方差齐性检验是其最原始的用途,也与我们前面内容一脉相承,其他的用途在本文不过多介绍。在此之前我们先思考一个问题,前面的U和T检验都是对正态总体的均值进行假设,区别是方差是否已知,那么正态总体方差的检验又是什么样呢?

单样本正态总体方差检验

内容 μ = μ 0 \mu=\mu_0 μ=μ0已知 μ \mu μ未知
假设 H 0 : σ = σ 0 H_0: \sigma=\sigma_0 H0:σ=σ0 H 1 : σ ≠ σ 0 H_1: \sigma\neq\sigma_0 H1:σ=σ0 H 0 : σ = σ 0 H_0: \sigma=\sigma_0 H0:σ=σ0 H 1 : σ ≠ σ 0 H_1: \sigma\neq\sigma_0 H1:σ=σ0
满足分布 ∑ i = 1 n ( X i − μ 0 ) 2 σ 2 ∼ X 2 ( n ) \frac{\sum_{i=1}^n(X_i-\mu_0)^2}{\sigma^2}\sim\mathcal{X}^2(n) σ2i=1n(Xiμ0)2X2(n) ∑ i = 1 n ( X i − X ‾ ) 2 σ 2 ∼ X 2 ( n − 1 ) \frac{\sum_{i=1}^n(X_i-\overline X)^2}{\sigma^2}\sim\mathcal{X}^2(n-1) σ2i=1n(XiX)2X2(n1)
检验统计量 X 2 = ∑ i = 1 n ( X i − μ 0 ) 2 σ 0 2 \mathcal{X}^2=\frac{\sum_{i=1}^n(X_i-\mu_0)^2}{\sigma_0^2} X2=σ02i=1n(Xiμ0)2 X 2 = ∑ i = 1 n ( X i − X ‾ ) 2 σ 0 2 \mathcal{X}^2=\frac{\sum_{i=1}^n(X_i-\overline X)^2}{\sigma_0^2} X2=σ02i=1n(XiX)2
拒绝域 { X 2 < X 1 − α / 2 2 ( n ) } ∪ { X 2 > X α / 2 2 ( n ) } \{\mathcal{X}^2<\mathcal{X}_{1-\alpha/2}^2(n)\}\cup\{\mathcal{X}^2>\mathcal{X}_{\alpha/2}^2(n)\} {X2<X1α/22(n)}{X2>Xα/22(n)} { X 2 < X 1 − α / 2 2 ( n − 1 ) } ∪ { X 2 > X α / 2 2 ( n − 1 ) } \{\mathcal{X}^2<\mathcal{X}_{1-\alpha/2}^2(n-1)\}\cup\{\mathcal{X}^2>\mathcal{X}_{\alpha/2}^2(n-1)\} {X2<X1α/22(n1)}{X2>Xα/22(n1)}

双样本正态总体方差检验(方差齐性检验)

内容 μ 1 \mu_1 μ1 μ 2 \mu_2 μ2已知 μ 1 \mu_1 μ1 μ 2 \mu_2 μ2未知
假设 H 0 : σ 1 = σ 2 H_0: \sigma_1=\sigma_2 H0:σ1=σ2 H 1 : σ 1 ≠ σ 2 H_1: \sigma_1\neq\sigma_2 H1:σ1=σ2 H 0 : σ 1 = σ 2 H_0: \sigma_1=\sigma_2 H0:σ1=σ2 H 1 : σ 1 ≠ σ 2 H_1: \sigma_1\neq\sigma_2 H1:σ1=σ2
满足分布 ∑ i = 1 n ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n ∼ F ( m , n ) \frac{\sum_{i=1}^n(X_i-\mu_1)^2/m}{\sum_{i=1}^n(Y_i-\mu_2)^2/n}\sim F(m,n) i=1n(Yiμ2)2/ni=1n(Xiμ1)2/mF(m,n) ∑ i = 1 n ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) ∼ F ( m − 1 , n − 1 ) \frac{\sum_{i=1}^n(X_i-\overline X)^2/(m-1)}{\sum_{i=1}^n(Y_i-\overline Y)^2/(n-1)}\sim F(m-1,n-1) i=1n(YiY)2/(n1)i=1n(XiX)2/(m1)F(m1,n1)
检验统计量 F = ∑ i = 1 n ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n F=\frac{\sum_{i=1}^n(X_i-\mu_1)^2/m}{\sum_{i=1}^n(Y_i-\mu_2)^2/n} F=i=1n(Yiμ2)2/ni=1n(Xiμ1)2/m F = ∑ i = 1 n ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) F=\frac{\sum_{i=1}^n(X_i-\overline X)^2/(m-1)}{\sum_{i=1}^n(Y_i-\overline Y)^2/(n-1)} F=i=1n(YiY)2/(n1)i=1n(XiX)2/(m1)
拒绝域 { F < F 1 − α / 2 2 ( m , n ) } ∪ { F > F α / 2 2 ( m , n ) } \{F<F_{1-\alpha/2}^2(m,n)\}\cup\{F>F_{\alpha/2}^2(m,n)\} {F<F1α/22(m,n)}{F>Fα/22(m,n)} { F < F 1 − α / 2 2 ( m − 1 , n − 1 ) } ∪ { F > F α / 2 2 ( m − 1 , n − 1 ) } \{F<F_{1-\alpha/2}^2(m-1,n-1)\}\cup\{F>F_{\alpha/2}^2(m-1,n-1)\} {F<F1α/22(m1,n1)}{F>Fα/22(m1,n1)}
  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值