假设与检验

假设检验

公众号:ChallengeHub(机器学习,NLP,推荐系统,数据分析)
(欢迎大家关注)

​ 假设检验是统计推断的一种重要形式,其任务是通过样本对未知的总体分布特征作出合理的推断。先对总体分布中的某些参数或者对总体分布类型做某种假设,然后根据样本值做出接受还是拒绝所做假设的结论。

相关概念

原问题假设

问题假设是做假设检验的第一步,一般讲要检验的假设称为原假设,记为: H 0 H_0 H0,则另外一个为备选假设,指拒绝原假设时的假设,记为: H 1 H_1 H1

假设一般分为双边假设和单边假设。

双边假设: H 0 : μ = μ 0 H_0 : \mu=\mu_0 H0:μ=μ0, H 1 : μ ≠ μ 0 H_1 : \mu \ne\mu_0 H1:μ=μ0

单边假设: H 0 : μ ≤ μ 0 H_0 : \mu\le\mu_0 H0:μμ0, H 0 : μ > μ 0 H_0 : \mu\gt\mu_0 H0:μ>μ0

拒绝域与接受域

两类错误

H 0 H_0 H0为真 H 0 H_0 H0不真
拒绝 H 0 H_0 H0第一类错误正确
接受 H 0 H_0 H0正确第二类错误

第一类错误(弃真错误),原假设 H 0 H_0 H0为真,但是检验出的拒绝原假设,其概率为 α \alpha α,
P { 拒 绝 H 0 ∣ H 0 为 真 } = α P\{拒绝H_0|H_0为真\}=\alpha P{H0H0}=α
第二类错误(存伪错误),原假设 H 0 H_0 H0为假,但是检验出的接受了原假设,其概率为 β \beta β,
P { 接 受 H 0 ∣ H 0 为 假 } = β P\{接受H_0|H_0为假\}=\beta P{H0H0}=β
一般来说两种错误是相互矛盾的,不能同时降低两种错误,因此一般在限制 α \alpha α的情况下,尽可能地降低 β \beta β的值。

基本思想

小概率事件在一次的实验中是不可能发生的。

如果原假设成立,那么某个分布已知的统计量在**某个区域(拒绝域)内取值的概率 α \alpha α(检验水平)**应该较小,如果样本的观测数值落在这个小概率区域内,则原假设不正确,所以,拒绝原假设,否则,接受原假设。

基本步骤

第一步:问题假设

根据实际问题提出原假设 H 0 H_0 H0和备选假设 H 1 H_1 H1,其中 H 0 H_0 H0 H 1 H_1 H1是相互对立的。

例如:如 H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0, H 0 : μ ≠ μ 0 H_0:\mu\ne\mu_0 H0:μ=μ0

这种为双边检验

第二步:选取检验统计量

选取一个合适的检验统计量,并根据原假设 H 0 H_0 H0和备选假设 H 1 H_1 H1确定 H 0 H_0 H0的拒绝域

在根据上一步的假设,有:
P { ∣ μ ∣ < μ α 2 } = 1 − α P\{|\mu|<\mu_{\frac {\alpha}{2}}\}=1-\alpha P{μ<μ2α}=1α
或者
P { ∣ μ ∣ > μ α 2 } = α P\{|\mu|>\mu_{\frac {\alpha}{2}}\}=\alpha P{μ>μ2α}=α
则可以确定 ( − inf ⁡ , − μ α 2 ) ∪ ( μ α 2 , inf ⁡ ) (-\inf,-\mu_{\frac {\alpha}{2}})\cup(\mu_{\frac {\alpha}{2}},\inf) (inf,μ2α)(μ2α,inf) H 0 H_0 H0的拒绝域,而 ( − μ α 2 , μ α 2 ) (-\mu_{\frac {\alpha}{2}},\mu_{\frac {\alpha}{2}}) (μ2α,μ2α) H 0 H_0 H0的接受域, μ α 2 \mu_{\frac {\alpha}{2}} μ2α称为临界值。

第三步:给定显著性水平

一般 α \alpha α的取值为0.05,0.01,0.10等。

第四步:计算检验统计量的具体值

第五步:做出判断

相关练习

单个正态总体的假设检验

设总体 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) XN(μ,σ2), X 1 , X 2 . . . , X n X_1,X_2...,X_n X1,X2...,Xn是取自总体的样本, X ‾ , S 2 \overline X,S^2 X,S2为样本均值和方差, α \alpha α为显著性水平。

方差已知,均值检验( μ \mu μ检验法)
1:双边检验

假设: H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0, H 0 : μ ≠ μ 0 H_0:\mu\ne\mu_0 H0:μ=μ0

取检验统计量 U = X ‾ − μ 0 σ n U=\frac {\overline X-\mu_0}{\frac{\sigma}{\sqrt n}} U=n σXμ0, 当 H 0 H_0 H0成立时, U = X ‾ − μ 0 σ n ∼ N ( 0 , 1 ) U=\frac {\overline X-\mu_0}{\frac{\sigma}{\sqrt n}} \sim N(0,1) U=n σXμ0N(0,1)

对于给定的 α \alpha α,查正态分布表,使得
P { ∣ μ ∣ > μ α 2 } = α P\{|\mu|>\mu_{\frac{\alpha}{2}}\}=\alpha P{μ>μ2α}=α
于是得到 H 0 H_0 H0的拒绝域为 ( − inf ⁡ , − μ α 2 ) ∪ ( μ α 2 , inf ⁡ ) (-\inf,-\mu_{\frac {\alpha}{2}})\cup(\mu_{\frac {\alpha}{2}},\inf) (inf,μ2α)(μ2α,inf)

2:单边检验

假设: H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0, H 0 : μ > μ 0 H_0:\mu\gt\mu_0 H0:μ>μ0

H 0 H_0 H0成立时, U = X ‾ − μ 0 σ n ∼ N ( 0 , 1 ) U=\frac {\overline X-\mu_0}{\frac{\sigma}{\sqrt n}} \sim N(0,1) U=n σXμ0N(0,1)

H 0 H_0 H0成立时, μ \mu μ的值不应该很大,而当 H 1 H_1 H1成立时, μ \mu μ的值往往偏大。

因此,公式
P { ∣ μ ∣ > μ α } = α P\{|\mu|>\mu_{\alpha}\}=\alpha P{μ>μα}=α
于是得到拒绝域为 ( μ α , inf ⁡ ) (\mu_{\alpha},\inf) (μα,inf)

类似的,若 H 1 : μ < μ 0 H_1:\mu<\mu_0 H1:μ<μ0

可以得到 H 0 H_0 H0的拒绝域为 ( − inf ⁡ , − μ α ) (-\inf,-\mu_\alpha) (inf,μα)

3:例题

例1 由经验知某个零件的重量 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) XN(μ,σ2), μ = 15 \mu=15 μ=15, σ = 0.05 \sigma=0.05 σ=0.05; 技术革新后,抽出6个零件,测得的重量为14.7, 15.1, 14.8, 15.0, 15.2, 14.6。已知方差不变,试统计推断,平均重量是否还是15克。( α = 0.05 \alpha=0.05 α=0.05)

解:

假设: H 0 : μ = 15 H_0:\mu=15 H0:μ=15, H 0 : μ ≠ 15 H_0:\mu\ne15 H0:μ=15

构造 U U U统计量,得到 U U U的0.05双侧分位数为 μ 0.025 = 1.96 \mu_{0.025}=1.96 μ0.025=1.96

样本的均值为 x ‾ = 14.9 \overline x=14.9 x=14.9

因此 U U U统计量的观测值为 ∣ U ∣ = ∣ x ‾ − 15 0.05 / 6 ∣ = 4.9 |U|=|\frac {\overline x-15}{0.05/\sqrt6}|=4.9 U=0.05/6 x15=4.9

由于4.9大于1.96,即观测值落在拒绝域内,所以拒绝原假设。

方差未知,均值检验( t t t检验)
1:双边检验

假设: H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0, H 0 : μ ≠ μ 0 H_0:\mu\ne\mu_0 H0:μ=μ0

此时,整体 σ 2 \sigma^2 σ2未知,不能采用 U = X ‾ − μ 0 σ n U=\frac {\overline X-\mu_0}{\frac{\sigma}{\sqrt n}} U=n σXμ0, 因此需要用样本的方差来代替总体方差,

T = X ‾ − μ 0 S n T=\frac {\overline X-\mu_0}{\frac{S}{\sqrt n}} T=n SXμ0, 当 H 0 H_0 H0成立时, U = X ‾ − μ 0 S n ∼ t ( 0 , 1 ) U=\frac {\overline X-\mu_0}{\frac{S}{\sqrt n}} \sim t(0,1) U=n SXμ0t(0,1)

对于给定的 α \alpha α,查 t t t分布表,使得
P { ∣ t ∣ > t α 2 ( n − 1 ) } = α P\{|t|>t_{\frac{\alpha}{2}}(n-1)\}=\alpha P{t>t2α(n1)}=α
于是得到 H 0 H_0 H0的拒绝域为 ( − inf ⁡ , − t α 2 ( n − 1 ) ∪ ( t α 2 ( n − 1 ) , inf ⁡ ) (-\inf,-t_{\frac{\alpha}{2}}(n-1)\cup(t_{\frac{\alpha}{2}}(n-1),\inf) (inf,t2α(n1)(t2α(n1),inf)

2:单边检验

假设: H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0, H 0 : μ < μ 0 H_0:\mu<\mu_0 H0:μ<μ0

可得到的 H 0 H_0 H0的拒绝域为 ( − inf ⁡ , − t α 2 ( n − 1 ) (-\inf,-t_{\frac{\alpha}{2}}(n-1) (inf,t2α(n1)

3:例题

例2 化工厂用自动包装机包装化肥,每包重量服从正态分布,额定的重量为100千克。随机抽取了9袋化肥,发现均值为99.978,均方差为1.212,能否认为这天的化肥装机正常? ( α = 0.1 ) (\alpha=0.1) (α=0.1)

解:由于方差未知,采用 T T T检验法

假设: H 0 : μ = 100 H_0:\mu=100 H0:μ=100, H 0 : μ ≠ 100 H_0:\mu\ne100 H0:μ=100

构建 T T T统计量,得到 T T T的0.1双侧分位数为
t 0.05 ( 8 ) = 1.86 t_{0.05}(8)=1.86 t0.05(8)=1.86
T T T统计量的观测值为
∣ T ∣ = ∣ x ‾ − μ ∣ S / n = ∣ 99.978 − 100 1.212 / 9 ∣ = 0.0545 |T|=\frac {|\overline x-\mu|}{S/\sqrt n}=|\frac{99.978-100}{1.212/\sqrt 9}|=0.0545 T=S/n xμ=1.212/9 99.978100=0.0545
因此0.0545小于1.86,因此接受原假设,今天的包装机工作正常。

方差 σ 2 \sigma^2 σ2检验( χ 2 \chi^2 χ2检验)

假设: H 0 : σ 2 = σ 0 2 H_0:\sigma^2=\sigma_0^2 H0:σ2=σ02, H 0 : σ 2 ≠ σ 0 2 H_0:\sigma^2\ne\sigma_0^2 H0:σ2=σ02

检验统计量
χ 2 = ( n − 1 ) S 2 σ 0 2 \chi^2=\frac{(n-1)S^2}{\sigma_0^2} χ2=σ02(n1)S2
H 0 H_0 H0成立时
χ 2 = ( n − 1 ) S 2 σ 0 2 ∼ χ 2 ( n − 1 ) \chi^2=\frac{(n-1)S^2}{\sigma_0^2}\sim\chi^2(n-1) χ2=σ02(n1)S2χ2(n1)
例1 服从正态分布,抽取数为4.421,4.052,4.357,4.287,4.683,判断方差是否仍为0.108^2 ( α = 0.05 ) (\alpha=0.05) (α=0.05)

解:均值未知,的方差检验,用 χ 2 \chi^2 χ2检验法

假设: H 0 : σ 2 = 0.10 8 2 H_0:\sigma^2=0.108^2 H0:σ2=0.1082, H 0 : σ 2 ≠ 0.10 8 2 H_0:\sigma^2\ne0.108^2 H0:σ2=0.1082

α = 0.05 \alpha=0.05 α=0.05,得到临界值
χ 0.975 2 ( 4 ) = 0.048 , χ 0.025 2 ( 4 ) = 11.14 \chi_{0.975}^2(4)=0.048,\chi_{0.025}^2(4)=11.14 χ0.9752(4)=0.048,χ0.0252(4)=11.14
χ 2 \chi^2 χ2统计量的观测值为17.8543

因为 17.8543>11.14

所以拒绝原假设

两个正态总体的比较

假设总体 X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2) XN(μ1,σ12)YN(μ2,σ22), X 1 , X 2 . . . , X n , Y 1 , Y 2 . . . , Y n X_1,X_2...,X_n,Y_1,Y_2...,Y_n X1,X2...,Xn,Y1,Y2...,Yn是取自总体的样本。

有:

X ‾ = 1 n ∑ i = 1 n X i \overline X=\frac{1}{n}\sum_{i=1}^nX_i X=n1i=1nXi, S 1 2 = 1 n − 1 ∑ ( X i − X ‾ ) 2 S_1^2=\frac{1}{n-1}\sum(X_i-\overline X)^2 S12=n11(XiX)2

Y ‾ = 1 m ∑ ( Y i ) \overline Y=\frac 1m\sum(Y_i) Y=m1(Yi), S 2 2 = 1 m − 1 ∑ ( Y i − Y ‾ ) S_2^2=\frac{1}{m-1}\sum(Y_i-\overline Y) S22=m11(YiY)

两个样本相同独立

方差已知,均值检验( μ \mu μ检验法)

假设: H 0 : μ 1 = μ 2 H_0:\mu_1=\mu_2 H0:μ1=μ2, H 0 : μ 1 ≠ μ 2 H_0:\mu_1\ne\mu_2 H0:μ1=μ2

估计两个样本的均值是否相等,即 μ 1 − μ 2 = 0 \mu_1-\mu_2=0 μ1μ2=0

E ( X ‾ − Y ‾ ) = μ 1 − μ 2 E(\overline X-\overline Y)=\mu_1-\mu_2 E(XY)=μ1μ2

D ( X ‾ − Y ‾ ) = σ 1 2 n + σ 2 2 m D(\overline X-\overline Y)=\frac{\sigma_1^2}{n}+\frac{\sigma_2^2}{m} D(XY)=nσ12+mσ22

因此 X ‾ − Y ‾ ∼ N ( μ 1 − μ 2 , σ 1 2 n + σ 2 2 m ) \overline X-\overline Y \sim N(\mu_1-\mu_2,\frac{\sigma_1^2}{n}+\frac{\sigma_2^2}{m}) XYN(μ1μ2,nσ12+mσ22)

当原假设成立的时候,用检验假设统计量
U = ( X ‾ − Y ‾ ) σ 1 2 n + σ 2 2 m ∼ N ( 0 , 1 ) U=\frac{(\overline X-\overline Y)}{\sqrt{\frac{\sigma_1^2}{n}+\frac{\sigma_2^2}{m}}}\sim N(0,1) U=nσ12+mσ22 (XY)N(0,1)
给定的 α \alpha α,查正态表使得 P { ∣ μ ∣ > μ α 2 } = α P\{|\mu|>\mu_{\frac {\alpha}{2}}\}=\alpha P{μ>μ2α}=α

从而可以得到拒绝域为 ( − inf ⁡ , − μ α 2 ) ∪ ( μ α 2 , inf ⁡ ) (-\inf,-\mu_{\frac {\alpha}{2}})\cup(\mu_{\frac {\alpha}{2}},\inf) (inf,μ2α)(μ2α,inf)

方差未知,均值检验( μ \mu μ检验法)

使用样本的方差代替总体的方差(为什么会有强调两种方差相等?)

T = ( X ‾ − Y ‾ ) ( n − 1 ) S 1 2 + ( m − 1 ) S 2 2 n + m − 2 1 n + 1 m ∼ t ( n + m − 2 ) T=\frac {(\overline X-\overline Y)}{\sqrt{ \frac{(n-1)S_1^2+(m-1)S_2^2}{n+m-2}\sqrt {\frac 1n +\frac 1m}}}\sim t(n+m-2) T=n+m2(n1)S12+(m1)S22n1+m1 (XY)t(n+m2)

例题

甲:25 28 23 26 29 22

乙:28 23 30 25 21 27

服从正态分布,方差相等且未知 ( α = 0.05 ) (\alpha=0.05) (α=0.05)

方差的检验

假设: H 0 : σ 2 = σ 0 2 H_0:\sigma^2=\sigma_0^2 H0:σ2=σ02, H 0 : σ 2 ≠ σ 0 2 H_0:\sigma^2\ne\sigma_0^2 H0:σ2=σ02

检验统计量 F = S 1 2 S 2 2 F=\frac {S_1^2}{S_2^2} F=S22S12

H 0 H_0 H0成立时, F ∼ F ( n − 1 , m − 1 ) F\sim F(n-1,m-1) FF(n1,m1)

S 1 2 , S 2 2 是 σ 1 2 , σ 2 2 S_1^2,S_2^2 是\sigma_1^2,\sigma_2^2 S12,S22σ12,σ22的无偏估计,因此当 H 0 H_0 H0成立, F F F的值应该接近于1。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值