概率论与数理统计
第八章 假设检验
8.1 基本概念
一、假设检验问题
总体的分布未知:
- 分布类型未知(非参数假设 → \rightarrow →非参数假设检验)
- 参数未知(参数假设 → \rightarrow →参数假设检验)
二、假设检验基本概念
- 假设(参数假设/非参数假设)
- 假设检验(检验假设成立与否)(参数假设检验/非参数假设检验)
- 假设检验问题(显著性假设检验问题/ H 0 H_0 H0对 H 1 H_1 H1假设检验问题)
三、假设检验的思想与步骤
举例:100个球(红白两色),张三:“有99个白球”,任取一球是红球,问张三说的对吗?
解:假设张三说得对——99白1红
P
(
任
取
一
球
为
红
球
)
=
1
/
100
P(任取一球为红球)=1/100
P(任取一球为红球)=1/100
与“小概率实际不发生”,矛盾,因此认为张三说的不对
1. 思想
构造统计量
⟹
在
H
0
成
立
时
T
\displaystyle\overset{在H_0成立时}{\Longrightarrow}T
⟹在H0成立时T的分布已知
检验法则
⟺
P
(
T
∈
I
)
=
α
\Longleftrightarrow P(T\in I)=\alpha
⟺P(T∈I)=α(小概率)
P
(
(
X
1
,
⋯
,
X
n
)
∈
W
)
=
α
P((X_1,\cdots,X_n)\in W)=\alpha
P((X1,⋯,Xn)∈W)=α(
H
0
H_0
H0的拒绝域)
P
(
(
X
1
,
⋯
,
X
n
)
∈
W
‾
)
=
1
−
α
P((X_1,\cdots,X_n)\in \overline{W})=1-\alpha
P((X1,⋯,Xn)∈W)=1−α(
H
0
H_0
H0的接受域)
2. 步骤
第一步:提出
H
0
H_0
H0与
H
1
H_1
H1
第二步:假定
H
0
H_0
H0成立,取统计量
T
∼
T\sim
T∼已知分布
第三步:给
α
\alpha
α找到拒绝域
P
(
(
X
1
,
⋯
,
X
n
)
∈
W
)
=
α
P((X_1,\cdots,X_n)\in W)=\alpha
P((X1,⋯,Xn)∈W)=α
第四步:由样本
(
x
1
,
⋯
,
x
n
)
(x_1,\cdots,x_n)
(x1,⋯,xn)求出
T
T
T的值,若
(
x
1
,
⋯
,
x
n
)
∈
W
⟹
(x_1,\cdots,x_n)\in W\Longrightarrow
(x1,⋯,xn)∈W⟹拒绝
H
0
H_0
H0;若
(
x
1
,
⋯
,
x
n
)
∈
W
‾
⟹
(x_1,\cdots,x_n)\in \overline{W}\Longrightarrow
(x1,⋯,xn)∈W⟹接受
H
0
H_0
H0
四、两类错误
第一类错误:弃真
P
(
拒
绝
H
0
∣
H
0
为
真
)
=
α
P(拒绝H_0|H_0为真)=\alpha
P(拒绝H0∣H0为真)=α
第二类错误:纳伪
P
(
接
受
H
0
∣
H
0
为
假
)
=
β
P(接受H_0|H_0为假)=\beta
P(接受H0∣H0为假)=β
确保 α \alpha α的前提下尽可能减小 β \beta β
例
【例1】某化工厂用包装机自动包装洗衣粉。
已知洗衣粉重量(克)
X
∼
N
(
μ
,
2
2
)
X\sim N(\mu,2^2)
X∼N(μ,22),机器正常工作时,
μ
=
500
g
\mu=500g
μ=500g
某日开工后随机取9袋,其重量:500,499,502,506,498,498,497,510,503
假定
σ
=
2
\sigma=2
σ=2不变,问包装机工作是否正常?
解:
重量不是恰好
500
g
500g
500g原因:
- 随机误差(正常)
- 条件误差(不正常)
提出 H 0 : μ = 500 , h 1 : μ ≠ 500 H_0:\mu=500,h_1:\mu\not=500 H0:μ=500,h1:μ=500
假定
H
0
H_0
H0成立,
X
∼
N
(
500
,
4
)
X\sim N(500,4)
X∼N(500,4)
X
‾
∼
N
(
500
,
4
9
)
⟹
U
=
X
‾
−
500
2
/
3
∼
N
(
0
,
1
)
\displaystyle\overline{X}\sim N(500,\frac{4}{9})\Longrightarrow U=\frac{\overline{X}-500}{2/3}\sim N(0,1)
X∼N(500,94)⟹U=2/3X−500∼N(0,1)
P
(
∣
U
∣
>
u
α
2
)
=
α
\displaystyle P(|U|>u_{\frac{\alpha}{2}})=\alpha
P(∣U∣>u2α)=α
x
‾
=
1
9
∑
i
=
1
9
x
i
=
502
\displaystyle\overline{x}=\frac{1}{9}\sum\limits_{i=1}^{9}x_i=502
x=91i=1∑9xi=502
设
α
=
0.05
⇒
u
α
2
=
1.96
\alpha=0.05\Rightarrow u_{\frac{\alpha}{2}}=1.96
α=0.05⇒u2α=1.96
∣
u
∣
=
∣
502
−
500
∣
2
/
3
=
3
>
u
α
2
=
1.96
\displaystyle|u|=\frac{|502-500|}{2/3}=3>u_{\frac{\alpha}{2}}=1.96
∣u∣=2/3∣502−500∣=3>u2α=1.96
与“小概率实际不发生”矛盾
拒绝
H
0
H_0
H0,接受
H
1
H_1
H1
【例2】某厂灯管,寿命
X
∼
N
(
μ
,
40000
)
X\sim N(\mu,40000)
X∼N(μ,40000),平均寿命
μ
=
1500
\mu=1500
μ=1500小时
采取新工艺后,抽25只,平均寿命
x
‾
=
1675
\overline{x}=1675
x=1675小时
问新工艺后,灯泡寿命是否有显著提高?
解:
H
0
:
μ
=
1500
H_0:\mu=1500
H0:μ=1500(原假设)
H
1
:
μ
>
1500
H_1:\mu>1500
H1:μ>1500(备择假设/对立假设)
8.2 一个正态总体的参数假设检验
X ∼ N ( μ , σ 2 ) , ( X 1 , X 2 , ⋯ , X n ) X\sim N(\mu,\sigma^2),(X_1,X_2,\cdots,X_n) X∼N(μ,σ2),(X1,X2,⋯,Xn)为取自 X X X的样本,检验水平 α \alpha α
一、 μ \mu μ的假设检验
提出假设:
- H 0 : μ = μ 0 , H 1 : μ ≠ μ 0 H_0:\mu=\mu_0,H_1:\mu\not=\mu_0 H0:μ=μ0,H1:μ=μ0
- H 0 : μ ≤ μ 0 , H 1 : μ > μ 0 H_0:\mu\leq\mu_0,H_1:\mu>\mu_0 H0:μ≤μ0,H1:μ>μ0
- H 0 : μ ≥ μ 0 , H 1 : μ < μ 0 H_0:\mu\geq\mu_0,H_1:\mu<\mu_0 H0:μ≥μ0,H1:μ<μ0
U U U检验法: σ 2 = σ 0 2 \sigma^2=\sigma_0^2 σ2=σ02已知,检验 H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0
(以双侧检验为例)
第一步:
H
0
:
μ
=
μ
0
,
H
1
:
μ
≠
μ
0
H_0:\mu=\mu_0,H_1:\mu\not=\mu_0
H0:μ=μ0,H1:μ=μ0
第二步:假定
H
0
H_0
H0成立,
X
∼
(
μ
0
,
σ
0
2
)
X\sim(\mu_0,\sigma_0^2)
X∼(μ0,σ02)
取统计量
U
=
X
‾
−
μ
σ
0
/
μ
∼
N
(
0
,
1
)
\displaystyle U=\frac{\overline{X}-\mu}{\sigma_0/\mu}\sim N(0,1)
U=σ0/μX−μ∼N(0,1)
第三步:给定
α
\alpha
α,由
P
{
∣
U
∣
>
u
α
2
}
=
α
\displaystyle P\{|U|>u_{\frac{\alpha}{2}}\}=\alpha
P{∣U∣>u2α}=α,查表得
u
α
2
u_{\frac{\alpha}{2}}
u2α
拒绝域:
W
=
{
(
x
2
,
⋯
,
x
n
)
∣
∣
u
∣
>
u
α
2
}
W=\{(x_2,\cdots,x_n)||u|>u_{\frac{\alpha}{2}}\}
W={(x2,⋯,xn)∣∣u∣>u2α}
第四步:计算 U U U的值 ∣ u ∣ |u| ∣u∣与 u α 2 u_{\frac{\alpha}{2}} u2α比较,下结论——若 ∣ u ∣ > u α 2 |u|>u_{\frac{\alpha}{2}} ∣u∣>u2α,拒绝 H 0 H_0 H0;若 ∣ u ∣ < u α 2 |u|<u_{\frac{\alpha}{2}} ∣u∣<u2α,接受 H 0 H_0 H0;若 ∣ u ∣ = u α 2 |u|=u_{\frac{\alpha}{2}} ∣u∣=u2α,为慎重起见,再抽样,再检验。
例
【例1】某面粉厂用包装机包装面粉,每袋面粉的标准重量为10千克,现任取5袋:10.1,10,9.8,9.9,9.9,假设袋装面粉重
X
∼
N
(
μ
,
0.
1
2
)
X\sim N(\mu,0.1^2)
X∼N(μ,0.12),问包装机是否工作正常?(
α
=
0.05
\alpha=0.05
α=0.05)
解:
提出
H
0
:
μ
=
10
,
H
1
:
μ
≠
10
H_0:\mu=10,H_1:\mu\not=10
H0:μ=10,H1:μ=10
假定 H 0 H_0 H0成立, X ∼ N ( 10 , 0. 1 2 ) X\sim N(10,0.1^2) X∼N(10,0.12), U = X ‾ − 10 0.1 / 5 ∼ N ( 0 , 1 ) \displaystyle U=\frac{\overline{X}-10}{0.1/\sqrt{5}}\sim N(0,1) U=0.1/5X−10∼N(0,1)
α
=
0.05
,
P
(
∣
U
∣
>
u
α
2
)
=
0.05
⟹
u
α
2
=
1.96
\alpha=0.05,P(|U|>u_{\frac{\alpha}{2}})=0.05\Longrightarrow u_{\frac{\alpha}{2}}=1.96
α=0.05,P(∣U∣>u2α)=0.05⟹u2α=1.96
W
=
{
(
x
1
,
⋯
,
x
5
)
∣
∣
u
∣
>
1.96
}
W=\{(x_1,\cdots,x_5)||u|>1.96\}
W={(x1,⋯,x5)∣∣u∣>1.96}
计算 x ‾ = 9.94 , ∣ u ∣ = 1.34 < u α 2 = 1.96 \overline{x}=9.94,|u|=1.34<u_{\frac{\alpha}{2}}=1.96 x=9.94,∣u∣=1.34<u2α=1.96
接受 H 0 H_0 H0,认为包装机工作正常
【例2】规定灯泡的平均寿命不低于1200小时。现任取5只灯泡侧寿命:1170,1210,1220,1180,1190,设灯泡寿命
X
∼
N
(
μ
,
2
0
2
)
X\sim N(\mu,20^2)
X∼N(μ,202),问这批灯泡是否合格。(
α
=
0.05
\alpha=0.05
α=0.05)
解:
提出
H
0
:
μ
=
1200
,
H
1
:
μ
<
1200
H_0:\mu=1200,H_1:\mu<1200
H0:μ=1200,H1:μ<1200
假定
H
0
H_0
H0成立,
X
∼
N
(
1200
,
2
0
2
)
X\sim N(1200,20^2)
X∼N(1200,202)
U
=
X
‾
−
1200
20
/
5
∼
N
(
0
,
1
)
\displaystyle U=\frac{\overline{X}-1200}{20/\sqrt{5}}\sim N(0,1)
U=20/5X−1200∼N(0,1)
α
=
0.05
,
W
=
{
(
x
1
,
⋯
,
x
5
)
∣
u
<
−
u
α
}
\alpha=0.05,W=\{(x_1,\cdots,x_5)|u<-u_\alpha\}
α=0.05,W={(x1,⋯,x5)∣u<−uα}
计算
x
‾
=
1194
,
u
=
1194
−
1200
20
/
5
=
−
0.67
>
−
1.64
\overline{x}=1194,u=\displaystyle\frac{1194-1200}{20/\sqrt{5}}=-0.67>-1.64
x=1194,u=20/51194−1200=−0.67>−1.64
接受
H
0
H_0
H0,认为该批次灯泡合格。
T T T检验法: σ 2 \sigma^2 σ2未知,检验 H 0 : μ ≠ μ 0 H_0:\mu\not=\mu_0 H0:μ=μ0
(以双侧检验为例)
第一步:提出
H
0
:
μ
=
μ
0
,
H
1
:
μ
≠
μ
0
H_0:\mu=\mu_0,H_1:\mu\not=\mu_0
H0:μ=μ0,H1:μ=μ0
第二步:假定 H 0 H_0 H0成立,取 T = X ‾ − μ 0 s / n ∼ t ( n − 1 ) \displaystyle T=\frac{\overline{X}-\mu_0}{s/\sqrt{n}}\sim t(n-1) T=s/nX−μ0∼t(n−1)
第三步:给定
α
\alpha
α,由
P
(
∣
T
∣
>
t
α
2
(
n
−
1
)
)
=
α
\displaystyle P(|T|>t_{\frac{\alpha}{2}}(n-1))=\alpha
P(∣T∣>t2α(n−1))=α
拒绝域
W
=
{
(
x
1
,
⋯
,
x
n
)
∣
∣
t
∣
>
t
α
2
(
n
−
1
)
}
W=\{(x_1,\cdots,x_n)||t|>t_{\frac{\alpha}{2}}(n-1)\}
W={(x1,⋯,xn)∣∣t∣>t2α(n−1)}
第四步:计算 T T T的值,与 t α 2 ( n − 1 ) t_{\frac{\alpha}{2}}(n-1) t2α(n−1)比较,下结论
例
【例1】从一批灯泡中取50只测寿命,
x
‾
=
1900
\overline{x}=1900
x=1900小时,
S
=
490
S=490
S=490小时,以
α
=
1
%
\alpha=1\%
α=1%的水平检验这批灯泡的平均寿命是否是2000小时?(假设灯泡寿命
X
∼
N
(
μ
,
σ
2
)
X\sim N(\mu,\sigma^2)
X∼N(μ,σ2))
解:
提出
H
0
:
μ
=
2000
,
H
1
:
μ
≠
2000
H_0:\mu=2000,H_1:\mu\not=2000
H0:μ=2000,H1:μ=2000
假定 H 0 H_0 H0成立,取 T = X ‾ − 2000 s / 50 ∼ t ( 49 ) \displaystyle T=\frac{\overline{X}-2000}{s/\sqrt{50}}\sim t(49) T=s/50X−2000∼t(49)
α
=
0.01
⟹
t
α
2
(
49
)
=
2.68
\alpha=0.01\Longrightarrow t_{\frac{\alpha}{2}}(49)=2.68
α=0.01⟹t2α(49)=2.68
W
=
{
(
x
1
,
⋯
,
x
50
)
∣
∣
t
∣
>
2.68
}
W=\{(x_1,\cdots,x_{50})||t|>2.68\}
W={(x1,⋯,x50)∣∣t∣>2.68}
计算 T T T的值: ∣ t ∣ = ∣ x ‾ − 2000 s / 50 ∣ = 1.44 < 2.68 \displaystyle |t|=|\frac{\overline{x}-2000}{s/\sqrt{50}}|=1.44<2.68 ∣t∣=∣s/50x−2000∣=1.44<2.68
接受 H 0 H_0 H0,认为平均寿命为2000小时
总结
二、 σ 2 \sigma^2 σ2的假设检验
χ 2 \chi^2 χ2检验法: μ = μ 0 \mu=\mu_0 μ=μ0已知,检验 σ 2 = σ 0 2 \sigma^2=\sigma_0^2 σ2=σ02
(以双侧检验为例)
第一步:
H
0
:
σ
2
=
σ
0
2
,
H
1
:
σ
0
≠
σ
0
2
H_0:\sigma^2=\sigma_0^2,H_1:\sigma_0\not=\sigma_0^2
H0:σ2=σ02,H1:σ0=σ02
第二步:假定
H
0
H_0
H0成立,
X
∼
N
(
μ
0
,
σ
0
2
)
X\sim N(\mu_0,\sigma_0^2)
X∼N(μ0,σ02),
X
1
,
⋯
,
X
n
X_1,\cdots,X_n
X1,⋯,Xn为样本
取统计量
χ
2
=
∑
i
=
1
n
(
X
i
−
μ
0
)
2
σ
0
2
∼
χ
2
(
n
)
\displaystyle\chi^2=\frac{\sum\limits_{i=1}^{n}(X_i-\mu_0)^2}{\sigma_0^2}\sim\chi^2(n)
χ2=σ02i=1∑n(Xi−μ0)2∼χ2(n)
第三步:给定
α
\alpha
α,由
P
(
χ
2
>
χ
α
2
2
(
n
)
=
P
(
χ
2
>
χ
1
−
α
2
2
(
n
)
)
=
α
2
\displaystyle P(\chi^2>\chi^2_{\frac{\alpha}{2}}(n)=P(\chi^2>\chi^2_{1-\frac{\alpha}{2}}(n))=\frac{\alpha}{2}
P(χ2>χ2α2(n)=P(χ2>χ1−2α2(n))=2α,查表得
χ
α
2
2
(
n
)
,
χ
1
−
α
2
2
(
n
)
\chi^2_{\frac{\alpha}{2}}(n),\chi^2_{1-\frac{\alpha}{2}}(n)
χ2α2(n),χ1−2α2(n)
拒绝域
W
=
{
χ
2
>
χ
α
2
2
(
n
)
或
χ
2
<
χ
1
−
α
2
2
(
n
)
}
W=\{\chi^2>\chi^2_{\frac{\alpha}{2}}(n)或\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n)\}
W={χ2>χ2α2(n)或χ2<χ1−2α2(n)}
第四步:计算 χ 2 \chi^2 χ2值,比较,下结论
χ 2 \chi^2 χ2检验法: μ \mu μ未知,检验 σ 2 = σ 0 2 \sigma^2=\sigma_0^2 σ2=σ02
(以双侧检验为例)
第一步:
H
0
:
σ
2
=
σ
0
2
,
H
1
:
σ
0
≠
σ
0
2
H_0:\sigma^2=\sigma_0^2,H_1:\sigma_0\not=\sigma_0^2
H0:σ2=σ02,H1:σ0=σ02
第二步:假定
H
0
H_0
H0成立,
X
∼
N
(
μ
,
σ
0
2
)
X\sim N(\mu,\sigma_0^2)
X∼N(μ,σ02),
X
1
,
⋯
,
X
n
X_1,\cdots,X_n
X1,⋯,Xn为样本
取统计量
χ
2
=
∑
i
=
1
n
(
X
i
−
X
‾
)
2
σ
0
2
∼
χ
2
(
n
−
1
)
\displaystyle\chi^2=\frac{\sum\limits_{i=1}^{n}(X_i-\overline{X})^2}{\sigma_0^2}\sim\chi^2(n-1)
χ2=σ02i=1∑n(Xi−X)2∼χ2(n−1)
第三步:给定
α
\alpha
α,由
P
(
χ
2
>
χ
α
2
2
(
n
−
1
)
=
P
(
χ
2
>
χ
1
−
α
2
2
(
n
−
1
)
)
=
α
2
\displaystyle P(\chi^2>\chi^2_{\frac{\alpha}{2}}(n-1)=P(\chi^2>\chi^2_{1-\frac{\alpha}{2}}(n-1))=\frac{\alpha}{2}
P(χ2>χ2α2(n−1)=P(χ2>χ1−2α2(n−1))=2α,查表得
χ
α
2
2
(
n
−
1
)
,
χ
1
−
α
2
2
(
n
−
1
)
\chi^2_{\frac{\alpha}{2}}(n-1),\chi^2_{1-\frac{\alpha}{2}}(n-1)
χ2α2(n−1),χ1−2α2(n−1)
拒绝域
W
=
{
χ
2
>
χ
α
2
2
(
n
−
1
)
或
χ
2
<
χ
1
−
α
2
2
(
n
−
1
)
}
W=\{\chi^2>\chi^2_{\frac{\alpha}{2}}(n-1)或\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n-1)\}
W={χ2>χ2α2(n−1)或χ2<χ1−2α2(n−1)}
第四步:计算 χ 2 \chi^2 χ2值,比较,下结论
例题
【例1】设成年男子身高
X
∼
N
(
μ
,
σ
2
)
X\sim N(\mu,\sigma^2)
X∼N(μ,σ2),现从某团体随机抽20名:
x
‾
=
1.702
,
S
=
0.07
\overline{x}=1.702,S=0.07
x=1.702,S=0.07,试检验总体方差是否是0.006?(
α
=
0.05
\alpha=0.05
α=0.05)
解:
提出
H
0
:
σ
2
=
0.006
,
H
1
:
σ
2
≠
0.006
H_0:\sigma^2=0.006,H_1:\sigma^2\not=0.006
H0:σ2=0.006,H1:σ2=0.006
假定
H
0
H_0
H0成立,取
χ
2
=
(
n
−
1
)
S
2
0.006
∼
χ
2
(
19
)
\displaystyle\chi^2=\frac{(n-1)S^2}{0.006}\sim\chi^2(19)
χ2=0.006(n−1)S2∼χ2(19)
α
=
0.005
⟹
χ
α
2
2
(
19
)
=
χ
0.025
2
(
19
)
=
32.9
,
χ
1
−
α
2
2
(
19
)
=
χ
0.975
2
(
19
)
=
8.91
\alpha=0.005\Longrightarrow\chi^2_{\frac{\alpha}{2}}(19)=\chi^2_{0.025}(19)=32.9,\chi^2_{1-\frac{\alpha}{2}}(19)=\chi^2_{0.975}(19)=8.91
α=0.005⟹χ2α2(19)=χ0.0252(19)=32.9,χ1−2α2(19)=χ0.9752(19)=8.91
计算
χ
2
=
(
20
−
1
)
0.0
7
2
0.006
=
15.571
\displaystyle\chi^2=\frac{(20-1)0.07^2}{0.006}=15.571
χ2=0.006(20−1)0.072=15.571
8.91
<
15.571
<
32.9
8.91<15.571<32.9
8.91<15.571<32.9
接受 H 0 H_0 H0,认为总体的方差是0.006
【例2】某种导线,要求电阻的标准差为0.005,现从一批导线中取9根,测得
S
=
0.007
S=0.007
S=0.007,设总体正态分布,问在
α
=
0.05
\alpha=0.05
α=0.05下能认为这批导线的标准差显著偏大吗?
解:
提出
H
0
:
σ
2
=
0.00
5
2
,
H
1
:
σ
2
>
0.00
5
2
H_0:\sigma^2=0.005^2,H_1:\sigma^2>0.005^2
H0:σ2=0.0052,H1:σ2>0.0052
假定
H
0
H_0
H0成立,
X
∼
N
(
μ
,
0.00
5
2
)
X\sim N(\mu,0.005^2)
X∼N(μ,0.0052)
χ
2
=
(
n
−
1
)
S
0.00
5
2
∼
χ
2
(
8
)
\displaystyle\chi^2=\frac{(n-1)S}{0.005^2}\sim\chi^2(8)
χ2=0.0052(n−1)S∼χ2(8)
α = 0.05 ⟹ χ α 2 ( 8 ) = 15.5 \alpha=0.05\Longrightarrow\chi_{\alpha}^{2}(8)=15.5 α=0.05⟹χα2(8)=15.5
计算 χ 2 = 8 × 0.00 7 2 0.00 5 2 = 15.68 > 15.5 \displaystyle\chi^2=\frac{8\times0.007^2}{0.005^2}=15.68>15.5 χ2=0.00528×0.0072=15.68>15.5
拒绝 H 0 H_0 H0,认为导线的标准差显著偏大
总结
8.3 两个正态总体的参数假设检验
X
∼
N
(
μ
1
,
σ
1
2
)
X\sim N(\mu_1,\sigma_1^2)
X∼N(μ1,σ12),
X
1
,
⋯
,
X
n
1
X_1,\cdots,X_{n_1}
X1,⋯,Xn1为样本,
X
‾
\overline{X}
X,
S
1
2
S_1^2
S12
Y
∼
N
(
μ
2
,
σ
2
2
)
Y\sim N(\mu_2,\sigma_2^2)
Y∼N(μ2,σ22),
Y
1
,
⋯
,
Y
n
2
Y_1,\cdots,Y_{n_2}
Y1,⋯,Yn2为样本,
Y
‾
\overline{Y}
Y,
S
2
2
S_2^2
S22
均值 μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2差异性检验
- 假设 H 0 : μ 1 = μ 2 , H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2,H_1:\mu_1\not=\mu_2 H0:μ1=μ2,H1:μ1=μ2
- 假设 H 0 : μ 1 ≤ μ 2 , H 1 : μ 1 ≯ μ 2 H_0:\mu_1\leq\mu_2,H_1:\mu_1\not>\mu_2 H0:μ1≤μ2,H1:μ1>μ2
- 假设 H 0 : μ 1 ≥ μ 2 , H 1 : μ 1 ≮ μ 2 H_0:\mu_1\geq\mu_2,H_1:\mu_1\not<\mu_2 H0:μ1≥μ2,H1:μ1<μ2
U U U检验法: σ 1 2 , σ 2 2 \sigma_1^2,\sigma_2^2 σ12,σ22已知,检验 H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0
(以双边检验为例)
第一步:提出
H
0
:
μ
1
=
μ
2
,
H
1
:
μ
1
≠
μ
2
H_0:\mu_1=\mu_2,H_1:\mu_1\not=\mu_2
H0:μ1=μ2,H1:μ1=μ2
第二步:假定
H
0
H_0
H0成立
X
‾
−
Y
‾
∼
N
(
μ
1
−
μ
2
,
σ
1
2
n
1
+
σ
2
2
n
2
)
\displaystyle\overline{X}-\overline{Y}\sim N(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2})
X−Y∼N(μ1−μ2,n1σ12+n2σ22)
⟹
\displaystyle\Longrightarrow
⟹ 取
U
=
X
‾
−
Y
‾
−
(
μ
1
−
μ
2
)
σ
1
2
n
1
+
σ
2
2
n
2
=
X
‾
−
Y
‾
σ
1
2
n
1
+
σ
2
2
n
2
∼
N
(
0
,
1
)
U=\frac{\overline{X}-\overline{Y}-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}=\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1)
U=n1σ12+n2σ22X−Y−(μ1−μ2)=n1σ12+n2σ22X−Y∼N(0,1)
第三步:给定
α
\alpha
α,由
P
(
∣
U
∣
>
u
α
2
)
=
α
P(|U|>u_{\frac{\alpha}{2}})=\alpha
P(∣U∣>u2α)=α,查表得
u
α
2
u_{\frac{\alpha}{2}}
u2α
拒绝域
W
=
{
(
x
1
,
⋯
,
x
n
1
)
(
y
1
,
⋯
,
y
n
2
)
∣
∣
u
∣
>
u
α
2
}
W=\{(x_1,\cdots,x_{n_1})(y_1,\cdots,y_{n_2})||u|>u_{\frac{\alpha}{2}}\}
W={(x1,⋯,xn1)(y1,⋯,yn2)∣∣u∣>u2α}
第四步:计算 ∣ u ∣ |u| ∣u∣, ∣ u ∣ |u| ∣u∣与 u α 2 u_{\frac{\alpha}{2}} u2α比较,下结论
T T T检验法: σ 1 2 , σ 2 2 \sigma_1^2,\sigma_2^2 σ12,σ22未知, σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2,检验 H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0
(以双边检验为例)
第一步:提出
H
0
:
μ
1
=
μ
2
,
H
1
:
μ
1
≠
μ
2
H_0:\mu_1=\mu_2,H_1:\mu_1\not=\mu_2
H0:μ1=μ2,H1:μ1=μ2
第二步:假定 H 0 H_0 H0成立,取 T = X ‾ − Y ‾ ( n 1 − 1 ) s 1 2 + ( n 2 − 1 ) s 2 2 n 1 + n 2 − 2 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) \displaystyle T=\frac{\overline{X}-\overline{Y}}{\displaystyle\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2) T=n1+n2−2(n1−1)s12+(n2−1)s22n11+n21X−Y∼t(n1+n2−2)
第三步:给定
α
\alpha
α,由
P
(
∣
T
∣
>
t
α
2
)
=
α
P(|T|>t_{\frac{\alpha}{2}})=\alpha
P(∣T∣>t2α)=α,查表得
t
α
2
(
n
1
+
n
2
−
2
)
t_{\frac{\alpha}{2}}(n_1+n_2-2)
t2α(n1+n2−2)
拒绝域
W
=
{
(
x
1
,
⋯
,
x
n
1
)
(
y
1
,
⋯
,
y
n
2
)
∣
∣
t
∣
>
t
α
2
}
W=\{(x_1,\cdots,x_{n_1})(y_1,\cdots,y_{n_2})||t|>t_{\frac{\alpha}{2}}\}
W={(x1,⋯,xn1)(y1,⋯,yn2)∣∣t∣>t2α}
第四步:计算 ∣ t ∣ |t| ∣t∣, ∣ t ∣ |t| ∣t∣与 t α 2 t_{\frac{\alpha}{2}} t2α比较,下结论
例题
【例1】卷烟厂向化验室送去
A
,
B
A,B
A,B两种烟草,化验尼古丁含量是否相同,从
A
,
B
A,B
A,B各取5例化验:A:24,27,26,21,24;B:27,28,23,31,26,设A的尼古丁含量
X
∼
N
(
μ
1
,
5
)
X\sim N(\mu_1,5)
X∼N(μ1,5),B的尼古丁含量
Y
∼
N
(
μ
2
,
8
)
Y\sim N(\mu_2,8)
Y∼N(μ2,8),问两种烟草尼古丁平均含量是否有差异(
α
=
0.05
\alpha=0.05
α=0.05)
解:
提出
H
0
:
μ
1
=
μ
2
,
H
1
:
μ
1
≠
μ
2
H_0:\mu_1=\mu_2,H_1:\mu_1\not=\mu_2
H0:μ1=μ2,H1:μ1=μ2
假设 H 0 H_0 H0成立, σ 1 2 = 5 , σ 2 2 = 8 \sigma_1^2=5,\sigma_2^2=8 σ12=5,σ22=8,取 U = X ‾ − Y ‾ 5 5 + 8 5 ∼ N ( 0 , 1 ) \displaystyle U=\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{5}{5}+\frac{8}{5}}}\sim N(0,1) U=55+58X−Y∼N(0,1)
α
=
0.05
⟹
u
α
2
=
1.96
\alpha=0.05\Longrightarrow u_{\frac{\alpha}{2}}=1.96
α=0.05⟹u2α=1.96
拒绝域
W
=
{
(
x
1
,
⋯
,
x
n
1
)
(
y
1
,
⋯
,
y
n
2
)
∣
∣
u
∣
>
1.96
}
W=\{(x_1,\cdots,x_{n_1})(y_1,\cdots,y_{n_2})||u|>1.96\}
W={(x1,⋯,xn1)(y1,⋯,yn2)∣∣u∣>1.96}
x
‾
=
24.4
,
y
‾
=
27
\overline{x}=24.4,\overline{y}=27
x=24.4,y=27
∣
u
∣
=
1.612
<
u
α
2
=
1.96
|u|=1.612<u_{\frac{\alpha}{2}}=1.96
∣u∣=1.612<u2α=1.96
接受 H 0 H_0 H0,认为两种烟草尼古丁的平均含量无差异
【例2】要考察温度对针织品断裂强力的影响,为了比较70℃和80℃的影响有无差别,分别做5次试验:
70℃强力:20.5,18.8,19.8,20.9,21.5,
X
∼
N
(
μ
1
,
σ
2
)
X\sim N(\mu_1,\sigma^2)
X∼N(μ1,σ2)
80℃强力:17.7,20.3,20.0,18.1,19.0,
Y
∼
N
(
μ
2
,
σ
2
)
Y\sim N(\mu_2,\sigma^2)
Y∼N(μ2,σ2)
问两种温度下,强力是否有显著差异?(
α
=
0.05
\alpha=0.05
α=0.05)
解:
提出
H
0
:
μ
1
=
μ
2
,
H
1
:
μ
1
≠
μ
2
H_0:\mu_1=\mu_2,H_1:\mu_1\not=\mu_2
H0:μ1=μ2,H1:μ1=μ2
假设 H 0 H_0 H0成立, σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2未知,取 T = X ‾ − Y ‾ 4 S 1 2 + 4 S 2 2 8 1 5 + 1 5 ∼ t ( 8 ) \displaystyle T=\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{4S_1^2+4S_2^2}{8}}\sqrt{\frac{1}{5}+\frac{1}{5}}}\sim t(8) T=84S12+4S2251+51X−Y∼t(8)
α
=
0.05
⟹
t
α
2
(
8
)
=
2.306
\alpha=0.05\Longrightarrow t_{\frac{\alpha}{2}}(8)=2.306
α=0.05⟹t2α(8)=2.306
拒绝域
W
=
{
(
x
1
,
⋯
,
x
n
1
)
(
y
1
,
⋯
,
y
n
2
)
∣
∣
t
∣
>
2.306
}
W=\{(x_1,\cdots,x_{n_1})(y_1,\cdots,y_{n_2})||t|>2.306\}
W={(x1,⋯,xn1)(y1,⋯,yn2)∣∣t∣>2.306}
x
‾
=
20.3
,
y
‾
=
19.02
,
(
n
1
−
1
)
S
1
2
=
4.34
,
(
n
2
−
1
)
S
2
2
=
5.188
\overline{x}=20.3,\overline{y}=19.02,(n_1-1)S_1^2=4.34,(n_2-1)S_2^2=5.188
x=20.3,y=19.02,(n1−1)S12=4.34,(n2−1)S22=5.188
∣
t
∣
=
1.855
<
t
α
2
(
8
)
=
2.306
|t|=1.855<t_{\frac{\alpha}{2}}(8)=2.306
∣t∣=1.855<t2α(8)=2.306
接受 H 0 H_0 H0,认为两种温度下强力无显著差异
总结
方差 σ 1 2 , σ 2 2 \sigma_1^2,\sigma_2^2 σ12,σ22差异性检验
- 假设 H 0 : σ 1 2 = σ 2 2 , H 1 : σ 1 2 ≠ σ 2 2 H_0:\sigma_1^2=\sigma_2^2,H_1:\sigma_1^2\not=\sigma_2^2 H0:σ12=σ22,H1:σ12=σ22
- 假设 H 0 : σ 1 2 ≤ σ 2 2 , H 1 : σ 1 2 > σ 2 2 H_0:\sigma_1^2\leq\sigma_2^2,H_1:\sigma_1^2>\sigma_2^2 H0:σ12≤σ22,H1:σ12>σ22
- 假设 H 0 : σ 1 2 ≥ σ 2 2 , H 1 : σ 1 2 < σ 2 2 H_0:\sigma_1^2\geq\sigma_2^2,H_1:\sigma_1^2<\sigma_2^2 H0:σ12≥σ22,H1:σ12<σ22
μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2都未知,检验 H 0 : σ 1 2 = σ 2 2 H_0:\sigma_1^2=\sigma_2^2 H0:σ12=σ22
(以双侧检验为例)
第一步:提出
H
0
:
σ
1
2
=
σ
2
2
,
H
1
:
σ
1
2
≠
σ
2
2
H_0:\sigma_1^2=\sigma_2^2,H_1:\sigma_1^2\not=\sigma_2^2
H0:σ12=σ22,H1:σ12=σ22
第二步:假设 H 0 H_0 H0成立,取 F = S 1 2 / σ 1 2 S 2 2 / σ 2 2 = S 1 2 S 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) \displaystyle F=\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}=\frac{S_1^2}{S_2^2}\sim F(n_1-1,n_2-1) F=S22/σ22S12/σ12=S22S12∼F(n1−1,n2−1)
第三步:给定
α
\alpha
α,由
P
(
F
>
F
α
2
)
=
P
(
F
<
F
1
−
α
2
)
=
α
2
P(F>F_{\frac{\alpha}{2}})=P(F<F_{1-\frac{\alpha}{2}})=\frac{\alpha}{2}
P(F>F2α)=P(F<F1−2α)=2α
(计算时用到公式:
F
1
−
α
2
(
n
1
−
1
,
n
2
−
1
)
=
F
α
2
(
n
2
−
1
,
n
1
−
1
)
F_{1-\frac{\alpha}{2}}(n_1-1,n_2-1)=F_{\frac{\alpha}{2}}(n_2-1,n_1-1)
F1−2α(n1−1,n2−1)=F2α(n2−1,n1−1))
拒绝域
W
=
{
(
x
1
,
⋯
,
x
n
1
)
(
y
1
,
⋯
,
y
n
2
)
∣
f
>
f
α
2
(
n
1
−
1
,
n
2
−
1
)
或
f
<
f
1
−
α
2
(
n
1
−
1
,
n
2
−
1
)
}
W=\{(x_1,\cdots,x_{n_1})(y_1,\cdots,y_{n_2})|f>f_{\frac{\alpha}{2}}(n_1-1,n_2-1)或f<f_{1-\frac{\alpha}{2}}(n_1-1,n_2-1)\}
W={(x1,⋯,xn1)(y1,⋯,yn2)∣f>f2α(n1−1,n2−1)或f<f1−2α(n1−1,n2−1)}
第四步:计算 F F F的值 f f f,比较,下结论
例题
【例1】从两处煤矿各抽样数次,分析其含灰率。设各煤矿含灰率都服从正态分布,
n
1
=
5
,
n
2
=
4
n_1=5,n_2=4
n1=5,n2=4,得
S
1
2
=
7.505
,
S
2
2
=
2.593
S_1^2=7.505,S_2^2=2.593
S12=7.505,S22=2.593,问两处煤矿含灰率的方差有无显著差异?(
α
=
0.05
\alpha=0.05
α=0.05)
解:
提出
H
0
:
σ
1
2
=
σ
2
2
,
H
1
:
σ
1
2
≠
σ
2
2
H_0:\sigma_1^2=\sigma_2^2,H_1:\sigma_1^2\not=\sigma_2^2
H0:σ12=σ22,H1:σ12=σ22
若 H 0 H_0 H0成立,取 F = S 1 2 S 2 2 ∼ F ( 4 , 3 ) \displaystyle F=\frac{S1^2}{S_2^2}\sim F(4,3) F=S22S12∼F(4,3)
α = 0.05 , F 0.025 ( 4 , 3 ) = 15.10 , F 0.975 ( 4 , 3 ) = 1 F 0.025 ( 3 , 4 ) = 1 9.98 \displaystyle\alpha=0.05,F_{0.025}(4,3)=15.10,F_{0.975}(4,3)=\frac{1}{F_{0.025}(3,4)}=\frac{1}{9.98} α=0.05,F0.025(4,3)=15.10,F0.975(4,3)=F0.025(3,4)1=9.981
计算
f
=
7.505
2.593
=
2.894
\displaystyle f=\frac{7.505}{2.593}=2.894
f=2.5937.505=2.894
0.1
<
f
<
15.1
0.1<f<15.1
0.1<f<15.1
接受
H
0
H_0
H0,认为两处煤矿含灰率的方差无显著差异
【例2】甲乙两台机床产同一滚珠,其直径都服从正态分布。现从两台车床生产产品分别取8个和9个测量直径得
S
1
2
=
0.096
,
S
2
2
=
0.026
S_1^2=0.096,S_2^2=0.026
S12=0.096,S22=0.026,问甲车床滚珠直径的方差是否不超过乙车床?
解:
提出
H
0
:
σ
1
2
=
σ
2
2
,
H
1
:
σ
1
2
>
σ
2
2
H_0:\sigma_1^2=\sigma_2^2,H_1:\sigma_1^2>\sigma_2^2
H0:σ12=σ22,H1:σ12>σ22
若
H
0
H_0
H0成立,取
F
=
S
1
2
S
2
2
∼
F
(
7
,
8
)
\displaystyle F=\frac{S1^2}{S_2^2}\sim F(7,8)
F=S22S12∼F(7,8)
α
=
0.05
,
F
0.05
(
7
,
8
)
=
3.50
\alpha=0.05,F_{0.05}(7,8)=3.50
α=0.05,F0.05(7,8)=3.50
计算
F
F
F的值,
f
=
0.096
0.026
=
3.96
>
3.5
\displaystyle f=\frac{0.096}{0.026}=3.96>3.5
f=0.0260.096=3.96>3.5
拒绝
H
0
H_0
H0,认为甲车床生产滚珠直径的方差超过乙车床
【例3】若将【例1】中的问题修改为“问两处煤矿含灰率的平均值有无显著差异?”
解:
先检验:
H
0
:
σ
1
2
=
σ
2
2
,
H
1
:
σ
1
2
≠
σ
2
2
H_0:\sigma_1^2=\sigma_2^2,H_1:\sigma_1^2\not=\sigma_2^2
H0:σ12=σ22,H1:σ12=σ22
F
=
S
1
2
S
2
2
∼
F
(
4
,
3
)
⟹
\displaystyle F=\frac{S_1^2}{S_2^2}\sim F(4,3)\Longrightarrow
F=S22S12∼F(4,3)⟹接受
H
0
⟹
σ
1
2
=
σ
2
2
H_0\Longrightarrow\sigma_1^2=\sigma_2^2
H0⟹σ12=σ22
再检验: H 0 : μ 1 = μ 2 , H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2,H_1:\mu_1\not=\mu_2 H0:μ1=μ2,H1:μ1=μ2( σ 1 2 = σ 2 2 \sigma_1^2=\sigma_2^2 σ12=σ22且未知 条件下)
区间估计——参数未知,利用统计量估计未知的参数
假设检验——参数已知,利用统计量检验已知的参数是否靠谱