第八章 假设检验
问题
由统计资料知,某品种煤的正常发热量服从均值为29300
、标准差为400
的正态分布
煤的发热量是一个随机变量
X
X ∼ N ( 29300 , 40 0 2 ) X \sim N(29300, 400^2) X∼N(29300,4002)
现在购买了一批该品种的煤,从中随机抽取了8
个试样,测得发热量为:
29060 | 28751 | 29998 | 29056 | 27554 | 29465 | 29022 | 28998 |
---|
问如果方差没有改变,这批煤的发热量是否正常?
分析:
假设这批煤的发热量为X
,并且
X
∼
N
(
μ
,
40
0
2
)
X \sim N(μ, 400^2)
X∼N(μ,4002)
如果这批煤的发热量正常,应该有 μ = 29300
,因此先提出假设:
H
0
:
μ
=
μ
0
=
29300
H_0:μ = μ_0 = 29300
H0:μ=μ0=29300
也就是H0 : μ = μ0, 这批煤是正常的
接下来要做的是对H0
进行判断,虽然样本均值x̄
是总体均值的无偏估计,但x̄
不一定恰好等于μ0
,所以要看x̄
与μ0
的差异是否很大(显著)
如果差异很大,则认为这批煤不正常;否则,认为这批煤是正常的
检验:
在H0
成立的条件下:
X
ˉ
∼
N
(
29300
,
40
0
2
)
,
U
=
X
ˉ
−
29300
400
/
8
∼
N
(
0
,
1
)
\bar X \sim N(29300, 400^2), \quad U = \frac{ \bar X - 29300 }{400/ \sqrt{8}} \sim N(0, 1)
Xˉ∼N(29300,4002),U=400/8Xˉ−29300∼N(0,1)
看到这里就需要思考,为什么要有一个
U
?我们要分析的问题是煤的发热量
X
是否正常,而采取的检验方式是:从总体中抽样,如果样本的均值与统计资料的均值相差不大,我们就认为这批煤是正常的。这个相差可以表示为
Y = x̄ - μ0
,如果可以得到Y
的分布,那自然是最好的,可惜没有,但是通过将X
标准化(正态分布→标准正态分布)我们就可以得到相近的结果,通过这个结果来分析
x̄ - μ0 = k
的概率,换句话说,可以通过U
间接得到P( |x̄ - μ0| > k )
其中,随机变量
U
是x̄
的标准正态分布后的结果
X ˉ = 1 n ( Σ i = 1 n X i ) \bar X = \frac{1}{n}(Σ_{i=1}^n Xi) Xˉ=n1(Σi=1nXi)∵ E ( X ˉ ) = E [ 1 n ( Σ i = 1 n X i ) ] = 1 n E ( Σ i = 1 n X i ) = 1 n ( n × μ ) = μ ∵\quad E(\bar X) = E[\frac{1}{n}(Σ_{i=1}^n Xi)] = \frac{1}{n} E(Σ_{i=1}^n Xi) = \frac{1}{n}(n×μ) = μ ∵E(Xˉ)=E[n1(Σi=1nXi)]=n1E(Σi=1nXi)=n1(n×μ)=μ
又 ∵ D ( X ˉ ) = D [ 1 n ( Σ i = 1 n X i ) ] = 1 n 2 D ( Σ i = 1 n X i ) = 1 n 2 ( n σ 2 ) = σ 2 n 又∵\quad D(\bar X) = D[\frac{1}{n}(Σ_{i=1}^n Xi)] = \frac{1}{n^2} D(Σ_{i=1}^n Xi) = \frac{1}{n^2}(nσ^2) = \frac{σ^2}{n} 又∵D(Xˉ)=D[n1(Σi=1nXi)]=n21D(Σi=1nXi)=n21(nσ2)=nσ2
∴ X ˉ ∼ N ( μ , σ 2 n ) = N ( 29300 , 40 0 2 8 ) ∴\quad \bar X \sim N(μ, \frac{σ^2}{n}) = N(29300, \frac{400^2}{8}) ∴Xˉ∼N(μ,nσ2)=N(29300,84002)
若给定一个较小的概率α
,取α = 0.05
使得:
P
{
∣
X
ˉ
−
29300
400
/
8
∣
≥
1.96
}
=
0.05
P\{ | \frac{\bar X-29300}{400/\sqrt{8}} | ≥ 1.96 \} = 0.05
P{∣400/8Xˉ−29300∣≥1.96}=0.05
P { ∣ X ˉ − 29300 ∣ ≥ 1.96 × 400 8 = 277.2277 } = 0.05 P\{ | \bar X-29300 | ≥ 1.96× \frac{400}{\sqrt{8}} = 277.2277 \} = 0.05 P{∣Xˉ−29300∣≥1.96×8400=277.2277}=0.05
其中:
U
α
2
=
1.96
(
上
α
2
分
位
数
)
U_{\frac{α}{2} = 1.96} \quad (上\frac{α}{2}分位数)
U2α=1.96(上2α分位数)
P
(
U
≥
U
α
2
=
α
2
)
P(U≥U_{\frac{α}{2}} = \frac{α}{2} )
P(U≥U2α=2α)
例如
也 就 是 说 : P { ∣ X ˉ − 29300 ∣ ≥ 277.2277 } 是 小 概 率 事 件 ( P < 0.05 ) 也就是说 : \quad P\{ | \bar X-29300 | ≥ 277.2277 \} \quad 是小概率事件(P<0.05) 也就是说:P{∣Xˉ−29300∣≥277.2277}是小概率事件(P<0.05)
结合问题,如果这批煤是正常的,那么抽出的那批煤的平均发热量x̄
与统计资料29300
之间的差值不会超过277.2277
(超过277.2277
是小概率事件)
反之,如果|x̄ - 29300| > 277.2277
,那么这批煤就是不正常的
由样本值计算得到:
∣
X
ˉ
−
29300
∣
=
302
>
277.2277
|\bar X - 29300| = 302 > 277.2277
∣Xˉ−29300∣=302>277.2277
这才进行了一次检验,小概率事件就发生了,有问题,这批煤是不正常的
因此拒绝H0
概念:
- 构造小概率事件用的统计量称为
检验统计量
- 如果统计量的观测值取某个区域
W
中的值时,拒绝假设H0
,则称W
为拒绝域
- 小概率事件发生的概率
α
,称为显著性水平
或水平
- 所提的假设
H0
称为原假设
或零假设
- 与原假设对立的假设用
H1
表示,称为备择假设