机器学习|单个正态总体的区间估计,均值、方差的置信区间求法+实际应用| 15mins 入门 |概统学习笔记(二十八)

(一)单个正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的区间估计

  1. 均值 μ \mu μ的置信区间

(1) σ 2 \sigma^2 σ2已知

X 1 , . . . , X n X_1,...,X_n X1,...,Xn是取自 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的样本, σ 2 \sigma^2 σ2已知,求参数 μ \mu μ的置信度为 1 − α 1-\alpha 1α的置信区间。

(明确问题,是求什么参数的置信区间?置信水平是多少?)

解:选 μ \mu μ的点估计为 X ‾ \overline X X X ‾ ∼ N ( μ , σ 2 n ) \overline X \sim N(\mu,\frac{\sigma^2}{n}) XN(μ,nσ2)

(寻找未知参数的一个良好估计,可用点估计法得到)

U = X ‾ − μ σ / n ∼ N ( 0 , 1 ) U=\frac{\overline X-\mu}{\sigma/\sqrt{n}} \sim N(0,1) U=σ/n XμN(0,1)

(寻找一个待估参数估计量的函数为枢轴量,要求其分布为已知,有了分布,就可以求出U取值于任意区间的概率)

对于给定的置信水平 1 − α 1-\alpha 1α,查正态分布表得 u α / 2 u_{\alpha /2} uα/2,使得
P { ∣ X ‾ − μ σ / n ∣ ≤ u α / 2 } = 1 − α P\{|\frac{\overline X -\mu}{\sigma/\sqrt n}|\leq u_{\alpha/2}\}=1-\alpha P{σ/n Xμuα/2}=1α
(对于给定的置信水平(大概率),根据U的分布,确定一个区间,使得U取值于该区间的概率为置信水平)

在这里插入图片描述

从中解得
P { X ‾ − σ n u α / 2 ≤ μ ≤ X ‾ + σ n u α / 2 } = 1 − α P\{\overline X-\frac{\sigma}{\sqrt n}u_{\alpha/2}\leq \mu \leq \overline X+ \frac{\sigma}{\sqrt n}u_{\alpha/2}\}=1-\alpha P{Xn σuα/2μX+n σuα/2}=1α
于是所求 μ \mu μ的置信区间为
[ X ‾ − σ n u a / 2 , X ‾ + σ n u α / 2 ] [\overline X-\frac{\sigma}{\sqrt n}u_{a/2}, \overline X+\frac{\sigma}{\sqrt n}u_{\alpha/2}] [Xn σua/2,X+n σuα/2]
也可简记为
X ‾ ± σ n u α / 2 \overline X \pm \frac{\sigma}{\sqrt n}u_{\alpha/2} X±n σuα/2
实际应用

一个车间生产滚珠,滚珠的直径服从正态分布,从某天的产品里随机抽出5个滚珠,量得直径如下(单位:mm)。如果已知该天滚珠直径的方差为0.05,试求平均直径的置信区间( α = 0.05 \alpha=0.05 α=0.05).

滚珠1滚珠2滚珠3滚珠4滚珠5
14.615.114.915.215.1

解:滚珠直径 X ∼ N ( μ , 0.05 ) X\sim N(\mu,0.05) XN(μ,0.05)
X ‾ = 14.6 + 15.1 + 14.9 + 15.2 + 15.1 5 = 14.98 ≈ μ \overline X=\frac{14.6+15.1+14.9+15.2+15.1}{5}=14.98 \approx \mu X=514.6+15.1+14.9+15.2+15.1=14.98μ
置信度为 1 − α = 0.95 1-\alpha=0.95 1α=0.95,所以 u a 2 = u 0.025 = 1.96 u_{\frac{a}{2}}=u_{0.025}=1.96 u2a=u0.025=1.96

于是要求的置信区间为
[ 14.98 − 1.96 × 0.05 5 , 14.98 + 1.96 × 0.05 5 ] = [ 14.8 , 15.2 ] [14.98-1.96\times \sqrt{\frac{0.05}{5}},14.98+1.96 \times \sqrt{\frac{0.05}{5}}]=[14.8,15.2] [14.981.96×50.05 ,14.98+1.96×50.05 ]=[14.8,15.2]
(2) σ 2 \sigma^2 σ2未知

σ 2 \sigma^2 σ2未知,故不能用前面给出 μ \mu μ的置信区间 [ X ‾ − σ n u a / 2 , X ‾ + σ n u a / 2 ] [\overline X-\frac{\sigma}{\sqrt n}u_{a/2},\overline X+\frac{\sigma}{\sqrt n}u_{a/2}] [Xn σua/2,X+n σua/2]

考虑到 S 2 S^2 S2 σ 2 \sigma^2 σ2的无偏估计,因此只需将 U = X ‾ − μ σ / n U=\frac{\overline X-\mu}{\sigma/\sqrt n} U=σ/n Xμ中的 σ \sigma σ换成 S = S 2 S=\sqrt{S^2} S=S2 ,于是有枢轴量(抽样分布定理3)
T = X ‾ − μ S / n ∼ t ( n − 1 ) T =\frac{\overline X-\mu}{S/\sqrt n} \sim t(n-1) T=S/n Xμt(n1)
进而得出 μ \mu μ的置信区间为
[ X ‾ − S n t a / 2 ( n − 1 ) , X ‾ + S n t a / 2 ( n − 1 ) ] [\overline X-\frac{S}{\sqrt n}t_{a/2}(n-1),\overline X+\frac{S}{\sqrt n}t_{a/2}(n-1)] [Xn Sta/2(n1),X+n Sta/2(n1)]
实际运用

​ 已知某种木材横纹抗压力的实验值服从正态分布,对10个试件作横纹抗压力试验得数据如下(单位:Mpa)

​ |48.2|49.3|45.7|47.1|51.0|44.6|43.5|41.8|39.4|46.9|

​ 试对该木材的平均横纹抗压力进行区间估计 ( α = 0.05 ) (\alpha=0.05) (α=0.05)

​ 解:总体的方差未知 σ 2 \sigma^2 σ2未知,对总体的 μ \mu μ值进行区间估计,应选用随机变量:
T = X ‾ − μ S / n ∼ t ( n − 1 ) T=\frac{\overline X-\mu}{S/\sqrt n}\sim t(n-1) T=S/n Xμt(n1)
​ 根据 P { ∣ T ∣ ≤ t a / 2 ( n − 1 ) } = 1 − α = 0.95 P\{|T|\leq t_{a/2}(n-1)\}=1-\alpha=0.95 P{Tta/2(n1)}=1α=0.95

​ 查自由度为10-1=9的t分布表得:
t a / 2 ( n − 1 ) = t 0.025 ( 9 ) = 2.262 t_{a/2}(n-1)=t_{0.025}(9)=2.262 ta/2(n1)=t0.025(9)=2.262
​ 即 P { ∣ X ‾ − μ S / n ∣ ≤ 2.262 } = 0.95 P\{|\frac{\overline X-\mu}{S/\sqrt n}|\leq 2.262\}=0.95 P{S/n Xμ2.262}=0.95

​ 于是平均横纹抗压力 μ \mu μ的置信区间为
[ X ‾ − S n × 2.262 , X ‾ + S n × 2.262 ] [\overline X-\frac{S}{\sqrt n}\times 2.262,\overline X+ \frac{S}{\sqrt n}\times 2.262] [Xn S×2.262,X+n S×2.262]
​ 将实验数据代入,得 X ‾ = 45.75 、 S = 35.218 \overline X=45.75、S=35.218 X=45.75S=35.218

​ 则平均横纹抗压力的置信区间为 [ 43.23 , 48.269 ] [43.23, 48.269] [43.23,48.269]

  1. 方差 σ 2 \sigma^2 σ2的置信区间

根据实际情况需要,只需要介绍 μ \mu μ未知下的 σ 2 \sigma^2 σ2的置信区间。由于 σ 2 \sigma^2 σ2的无偏估计为 S 2 S^2 S2,所以一般采用以下函数G(抽样分布定理2)为枢轴量。
G = ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) G=\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) G=σ2(n1)S2χ2(n1)
于是
P { χ 1 − a / 2 2 ( n − 1 ) < ( n − 1 ) S 2 σ 2 < χ a / 2 2 ( n − 1 ) } = 1 − a P\{\chi^2_{1-a/2}(n-1)<\frac{(n-1)S^2}{\sigma^2}<\chi^2_{a/2}(n-1)\}=1-a P{χ1a/22(n1)<σ2(n1)S2<χa/22(n1)}=1a

P { ( n − 1 ) S 2 χ a / 2 2 ( n − 1 ) < σ 2 < ( n − 1 ) S 2 χ 1 − a / 2 2 ( n − 1 ) } = 1 − a P\{\frac{(n-1)S^2}{\chi^2_{a/2}(n-1)}<\sigma^2<\frac{(n-1)S^2}{\chi^2_{1-a/2}(n-1)}\}=1-a P{χa/22(n1)(n1)S2<σ2<χ1a/22(n1)(n1)S2}=1a
进而得出 σ 2 \sigma^2 σ2的置信区间为
[ ( n − 1 ) S 2 χ a / 2 2 ( n − 1 ) , ( n − 1 ) S 2 χ 1 − a / 2 2 ( n − 1 ) ] [\frac{(n-1)S^2}{\chi^2_{a/2}(n-1)},\frac{(n-1)S^2}{\chi^2_{1-a/2}(n-1)}] [χa/22(n1)(n1)S2,χ1a/22(n1)(n1)S2]
标准差 σ \sigma σ的置信区间为
[ S n − 1 χ a / 2 2 ( n − 1 ) , S n − 1 χ 1 − a / 2 2 ( n − 1 ) ] [\frac{S\sqrt{n-1}}{\sqrt{\chi^2_{a/2}(n-1)}},\frac{S\sqrt{n-1}}{\sqrt{\chi^2_{1-a/2}(n-1)}}] [χa/22(n1) Sn1 ,χ1a/22(n1) Sn1 ]
如果 μ \mu μ已知,则选择的枢轴量为
U = X ‾ − μ σ / n ∼ N ( 0 , 1 ) U=\frac{\overline X-\mu}{\sigma/\sqrt n} \sim N(0,1) U=σ/n XμN(0,1)

实际应用

岩石密度的测量误差服从正态分布,随机抽测12个样品得S=0.2,求 σ 2 \sigma^2 σ2的置信区间(a=0.1)

解:以X表示测量误差, X ∼ N ( μ , σ 2 ) X\sim N(\mu, \sigma^2) XN(μ,σ2), 下面用样本的方差 S 2 = 0. 2 2 = 0.04 S^2=0.2^2=0.04 S2=0.22=0.04来估计总体的方差 σ 2 \sigma^2 σ2,对 σ 2 \sigma^2 σ2作区间估计(a=0.1),选用随机变量
X 2 = ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) X^2=\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) X2=σ2(n1)S2χ2(n1)
于是
P { ( n − 1 ) S 2 χ a / 2 2 ( n − 1 ) < σ 2 < ( n − 1 ) S 2 χ 1 − a / 2 2 ( n − 1 ) } = 0.9 P\{\frac{(n-1)S^2}{\chi^2_{a/2}(n-1)}<\sigma^2<\frac{(n-1)S^2}{\chi^2_{1-a/2}(n-1)}\}=0.9 P{χa/22(n1)(n1)S2<σ2<χ1a/22(n1)(n1)S2}=0.9
因为
χ 0.05 2 ( 12 − 1 ) = 19.675 χ 0.95 2 ( 12 − 1 ) = 4.575 \chi^2_{0.05}(12-1)=19.675 \\ \chi^2_{0.95}(12-1)=4.575 χ0.052(121)=19.675χ0.952(121)=4.575
σ 2 \sigma^2 σ2的置信区间为
[ ( n − 1 ) S 2 χ a / 2 2 ( n − 1 ) , ( n − 1 ) S 2 χ 1 − a / 2 2 ( n − 1 ) ] = [ 0.02 , 0.10 ] [\frac{(n-1)S^2}{\chi^2_{a/2}(n-1)},\frac{(n-1)S^2}{\chi^2_{1-a/2}(n-1)}]=[0.02,0.10] [χa/22(n1)(n1)S2,χ1a/22(n1)(n1)S2]=[0.02,0.10]

  • 3
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值