(一)单个正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的区间估计
- 均值 μ \mu μ的置信区间
(1) σ 2 \sigma^2 σ2已知
设 X 1 , . . . , X n X_1,...,X_n X1,...,Xn是取自 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的样本, σ 2 \sigma^2 σ2已知,求参数 μ \mu μ的置信度为 1 − α 1-\alpha 1−α的置信区间。
(明确问题,是求什么参数的置信区间?置信水平是多少?)
解:选 μ \mu μ的点估计为 X ‾ \overline X X, X ‾ ∼ N ( μ , σ 2 n ) \overline X \sim N(\mu,\frac{\sigma^2}{n}) X∼N(μ,nσ2)
(寻找未知参数的一个良好估计,可用点估计法得到)
取 U = X ‾ − μ σ / n ∼ N ( 0 , 1 ) U=\frac{\overline X-\mu}{\sigma/\sqrt{n}} \sim N(0,1) U=σ/nX−μ∼N(0,1)
(寻找一个待估参数和估计量的函数为枢轴量,要求其分布为已知,有了分布,就可以求出U取值于任意区间的概率)
对于给定的置信水平
1
−
α
1-\alpha
1−α,查正态分布表得
u
α
/
2
u_{\alpha /2}
uα/2,使得
P
{
∣
X
‾
−
μ
σ
/
n
∣
≤
u
α
/
2
}
=
1
−
α
P\{|\frac{\overline X -\mu}{\sigma/\sqrt n}|\leq u_{\alpha/2}\}=1-\alpha
P{∣σ/nX−μ∣≤uα/2}=1−α
(对于给定的置信水平(大概率),根据U的分布,确定一个区间,使得U取值于该区间的概率为置信水平)
从中解得
P
{
X
‾
−
σ
n
u
α
/
2
≤
μ
≤
X
‾
+
σ
n
u
α
/
2
}
=
1
−
α
P\{\overline X-\frac{\sigma}{\sqrt n}u_{\alpha/2}\leq \mu \leq \overline X+ \frac{\sigma}{\sqrt n}u_{\alpha/2}\}=1-\alpha
P{X−nσuα/2≤μ≤X+nσuα/2}=1−α
于是所求
μ
\mu
μ的置信区间为
[
X
‾
−
σ
n
u
a
/
2
,
X
‾
+
σ
n
u
α
/
2
]
[\overline X-\frac{\sigma}{\sqrt n}u_{a/2}, \overline X+\frac{\sigma}{\sqrt n}u_{\alpha/2}]
[X−nσua/2,X+nσuα/2]
也可简记为
X
‾
±
σ
n
u
α
/
2
\overline X \pm \frac{\sigma}{\sqrt n}u_{\alpha/2}
X±nσuα/2
实际应用:
一个车间生产滚珠,滚珠的直径服从正态分布,从某天的产品里随机抽出5个滚珠,量得直径如下(单位:mm)。如果已知该天滚珠直径的方差为0.05,试求平均直径的置信区间( α = 0.05 \alpha=0.05 α=0.05).
滚珠1 | 滚珠2 | 滚珠3 | 滚珠4 | 滚珠5 |
---|---|---|---|---|
14.6 | 15.1 | 14.9 | 15.2 | 15.1 |
解:滚珠直径
X
∼
N
(
μ
,
0.05
)
X\sim N(\mu,0.05)
X∼N(μ,0.05)
X
‾
=
14.6
+
15.1
+
14.9
+
15.2
+
15.1
5
=
14.98
≈
μ
\overline X=\frac{14.6+15.1+14.9+15.2+15.1}{5}=14.98 \approx \mu
X=514.6+15.1+14.9+15.2+15.1=14.98≈μ
置信度为
1
−
α
=
0.95
1-\alpha=0.95
1−α=0.95,所以
u
a
2
=
u
0.025
=
1.96
u_{\frac{a}{2}}=u_{0.025}=1.96
u2a=u0.025=1.96
于是要求的置信区间为
[
14.98
−
1.96
×
0.05
5
,
14.98
+
1.96
×
0.05
5
]
=
[
14.8
,
15.2
]
[14.98-1.96\times \sqrt{\frac{0.05}{5}},14.98+1.96 \times \sqrt{\frac{0.05}{5}}]=[14.8,15.2]
[14.98−1.96×50.05,14.98+1.96×50.05]=[14.8,15.2]
(2)
σ
2
\sigma^2
σ2未知
σ 2 \sigma^2 σ2未知,故不能用前面给出 μ \mu μ的置信区间 [ X ‾ − σ n u a / 2 , X ‾ + σ n u a / 2 ] [\overline X-\frac{\sigma}{\sqrt n}u_{a/2},\overline X+\frac{\sigma}{\sqrt n}u_{a/2}] [X−nσua/2,X+nσua/2]。
考虑到
S
2
S^2
S2是
σ
2
\sigma^2
σ2的无偏估计,因此只需将
U
=
X
‾
−
μ
σ
/
n
U=\frac{\overline X-\mu}{\sigma/\sqrt n}
U=σ/nX−μ中的
σ
\sigma
σ换成
S
=
S
2
S=\sqrt{S^2}
S=S2,于是有枢轴量(抽样分布定理3)
T
=
X
‾
−
μ
S
/
n
∼
t
(
n
−
1
)
T =\frac{\overline X-\mu}{S/\sqrt n} \sim t(n-1)
T=S/nX−μ∼t(n−1)
进而得出
μ
\mu
μ的置信区间为
[
X
‾
−
S
n
t
a
/
2
(
n
−
1
)
,
X
‾
+
S
n
t
a
/
2
(
n
−
1
)
]
[\overline X-\frac{S}{\sqrt n}t_{a/2}(n-1),\overline X+\frac{S}{\sqrt n}t_{a/2}(n-1)]
[X−nSta/2(n−1),X+nSta/2(n−1)]
实际运用
已知某种木材横纹抗压力的实验值服从正态分布,对10个试件作横纹抗压力试验得数据如下(单位:Mpa)
|48.2|49.3|45.7|47.1|51.0|44.6|43.5|41.8|39.4|46.9|
试对该木材的平均横纹抗压力进行区间估计 ( α = 0.05 ) (\alpha=0.05) (α=0.05)
解:总体的方差未知
σ
2
\sigma^2
σ2未知,对总体的
μ
\mu
μ值进行区间估计,应选用随机变量:
T
=
X
‾
−
μ
S
/
n
∼
t
(
n
−
1
)
T=\frac{\overline X-\mu}{S/\sqrt n}\sim t(n-1)
T=S/nX−μ∼t(n−1)
根据
P
{
∣
T
∣
≤
t
a
/
2
(
n
−
1
)
}
=
1
−
α
=
0.95
P\{|T|\leq t_{a/2}(n-1)\}=1-\alpha=0.95
P{∣T∣≤ta/2(n−1)}=1−α=0.95,
查自由度为10-1=9的t分布表得:
t
a
/
2
(
n
−
1
)
=
t
0.025
(
9
)
=
2.262
t_{a/2}(n-1)=t_{0.025}(9)=2.262
ta/2(n−1)=t0.025(9)=2.262
即
P
{
∣
X
‾
−
μ
S
/
n
∣
≤
2.262
}
=
0.95
P\{|\frac{\overline X-\mu}{S/\sqrt n}|\leq 2.262\}=0.95
P{∣S/nX−μ∣≤2.262}=0.95
于是平均横纹抗压力
μ
\mu
μ的置信区间为
[
X
‾
−
S
n
×
2.262
,
X
‾
+
S
n
×
2.262
]
[\overline X-\frac{S}{\sqrt n}\times 2.262,\overline X+ \frac{S}{\sqrt n}\times 2.262]
[X−nS×2.262,X+nS×2.262]
将实验数据代入,得
X
‾
=
45.75
、
S
=
35.218
\overline X=45.75、S=35.218
X=45.75、S=35.218
则平均横纹抗压力的置信区间为 [ 43.23 , 48.269 ] [43.23, 48.269] [43.23,48.269]
- 方差 σ 2 \sigma^2 σ2的置信区间
根据实际情况需要,只需要介绍
μ
\mu
μ未知下的
σ
2
\sigma^2
σ2的置信区间。由于
σ
2
\sigma^2
σ2的无偏估计为
S
2
S^2
S2,所以一般采用以下函数G(抽样分布定理2)为枢轴量。
G
=
(
n
−
1
)
S
2
σ
2
∼
χ
2
(
n
−
1
)
G=\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)
G=σ2(n−1)S2∼χ2(n−1)
于是
P
{
χ
1
−
a
/
2
2
(
n
−
1
)
<
(
n
−
1
)
S
2
σ
2
<
χ
a
/
2
2
(
n
−
1
)
}
=
1
−
a
P\{\chi^2_{1-a/2}(n-1)<\frac{(n-1)S^2}{\sigma^2}<\chi^2_{a/2}(n-1)\}=1-a
P{χ1−a/22(n−1)<σ2(n−1)S2<χa/22(n−1)}=1−a
即
P
{
(
n
−
1
)
S
2
χ
a
/
2
2
(
n
−
1
)
<
σ
2
<
(
n
−
1
)
S
2
χ
1
−
a
/
2
2
(
n
−
1
)
}
=
1
−
a
P\{\frac{(n-1)S^2}{\chi^2_{a/2}(n-1)}<\sigma^2<\frac{(n-1)S^2}{\chi^2_{1-a/2}(n-1)}\}=1-a
P{χa/22(n−1)(n−1)S2<σ2<χ1−a/22(n−1)(n−1)S2}=1−a
进而得出
σ
2
\sigma^2
σ2的置信区间为
[
(
n
−
1
)
S
2
χ
a
/
2
2
(
n
−
1
)
,
(
n
−
1
)
S
2
χ
1
−
a
/
2
2
(
n
−
1
)
]
[\frac{(n-1)S^2}{\chi^2_{a/2}(n-1)},\frac{(n-1)S^2}{\chi^2_{1-a/2}(n-1)}]
[χa/22(n−1)(n−1)S2,χ1−a/22(n−1)(n−1)S2]
标准差
σ
\sigma
σ的置信区间为
[
S
n
−
1
χ
a
/
2
2
(
n
−
1
)
,
S
n
−
1
χ
1
−
a
/
2
2
(
n
−
1
)
]
[\frac{S\sqrt{n-1}}{\sqrt{\chi^2_{a/2}(n-1)}},\frac{S\sqrt{n-1}}{\sqrt{\chi^2_{1-a/2}(n-1)}}]
[χa/22(n−1)Sn−1,χ1−a/22(n−1)Sn−1]
如果
μ
\mu
μ已知,则选择的枢轴量为
U
=
X
‾
−
μ
σ
/
n
∼
N
(
0
,
1
)
U=\frac{\overline X-\mu}{\sigma/\sqrt n} \sim N(0,1)
U=σ/nX−μ∼N(0,1)
实际应用
岩石密度的测量误差服从正态分布,随机抽测12个样品得S=0.2,求 σ 2 \sigma^2 σ2的置信区间(a=0.1)
解:以X表示测量误差,
X
∼
N
(
μ
,
σ
2
)
X\sim N(\mu, \sigma^2)
X∼N(μ,σ2), 下面用样本的方差
S
2
=
0.
2
2
=
0.04
S^2=0.2^2=0.04
S2=0.22=0.04来估计总体的方差
σ
2
\sigma^2
σ2,对
σ
2
\sigma^2
σ2作区间估计(a=0.1),选用随机变量
X
2
=
(
n
−
1
)
S
2
σ
2
∼
χ
2
(
n
−
1
)
X^2=\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)
X2=σ2(n−1)S2∼χ2(n−1)
于是
P
{
(
n
−
1
)
S
2
χ
a
/
2
2
(
n
−
1
)
<
σ
2
<
(
n
−
1
)
S
2
χ
1
−
a
/
2
2
(
n
−
1
)
}
=
0.9
P\{\frac{(n-1)S^2}{\chi^2_{a/2}(n-1)}<\sigma^2<\frac{(n-1)S^2}{\chi^2_{1-a/2}(n-1)}\}=0.9
P{χa/22(n−1)(n−1)S2<σ2<χ1−a/22(n−1)(n−1)S2}=0.9
因为
χ
0.05
2
(
12
−
1
)
=
19.675
χ
0.95
2
(
12
−
1
)
=
4.575
\chi^2_{0.05}(12-1)=19.675 \\ \chi^2_{0.95}(12-1)=4.575
χ0.052(12−1)=19.675χ0.952(12−1)=4.575
得
σ
2
\sigma^2
σ2的置信区间为
[
(
n
−
1
)
S
2
χ
a
/
2
2
(
n
−
1
)
,
(
n
−
1
)
S
2
χ
1
−
a
/
2
2
(
n
−
1
)
]
=
[
0.02
,
0.10
]
[\frac{(n-1)S^2}{\chi^2_{a/2}(n-1)},\frac{(n-1)S^2}{\chi^2_{1-a/2}(n-1)}]=[0.02,0.10]
[χa/22(n−1)(n−1)S2,χ1−a/22(n−1)(n−1)S2]=[0.02,0.10]