第八章假设检验
§8.1假设检验的概念
在总体X的分布完全未知,或只知其分布但不知其参数的情况下,我们对X的分布或分布中的参数做出某种假设,然后根据样本,用统计分析方法检验这一假设是否合理,从而作出接受或拒绝这一假设.
一、基本概念
对总体X的分布或分布中的参数提出假设,就称为统计假设
所提出的假设叫做原假设(或零假设),记为H 0 ,对立于原假设的假设称为备择假设(或对立假设),记为H 1 .
假设检验就是根据样本,适当构造一个统计量,按照某种规则,决定是接受H 0 (拒绝H 1 )还是拒绝H 0 (接受H 1 ),所使用的统计量称为检验统计量.
只对总体分布中的参数提出假设进行检验的问题,称为参数检验.
二、两类错误
由于检验法则是依据样本做出的,因此假设检验的结果可能犯两类错误:
第一类错误:当原假设H 0 为真时,作出的决定却是拒绝H 0 ,犯这类错误的概率记为α,即
P{拒绝H 0 |H 0 为真}=α.
第二类错误:当假设H 0 不正确时,作出的决定却是接受H 0 ,犯这类错误的概率记作β,即
P{接受H 0 |H 0 不正确}=β.
在确定检验法则时,应尽可能使犯两类错误的概率都较小.但是,一般说来,当样本容量给定以后,若减少犯某一类错误的概率,则犯另一类错误的概率往往会增大,要使犯两类错误的概率都减小,只有增大样本容量.
在给定样本容量的情况下,我们总是控制犯第一类错误的概率,让它小于或等于α,而不考虑犯第二类错误的概率.这种检验问题称为显著性检验问题.数α称为显著性水平.α的大小依据具体情况确定.通常取α=0.1,0.05,0.01.
在对假设进行检验时,常使用某个统计量T,称为检验统计量.
当检验统计量取某个区域W中的值时,我们就拒绝原假设H 0 ,则称区域W为拒绝域.拒绝域的边界点称为临界点.当检验统计量在某区域中取值时,我们就接受H 0 ,则称此区域为接受域.
例1.某车间用一台包装机包装味精,每袋标准重量为100g,由以往经验知每袋重量的标准差σ=0.5g保持不变,每隔一定时间需要检查包装机的工作情况,现抽取9袋,测得它们的净重为:99.0,100.2,99.3,99.1,99.6,99.2,99.9,100.1,99.3假定每袋重量服从正态分布,试问这段事件内包装机的工作是否正常(取显著性水平α=0.05)?
解:设每袋重量X∼N(μ,0.5 2 ),回答包装机的工作是否正常,相当于判断μ=100(=μ 0 )是否正确.因此原假设H 0 :μ=μ 0 =100,备择假设为H 1 :μ≠100.在H 0 正确条件下μ=X ¯ ¯ ¯ −μ 0 σ/n √ 是一个统计量,且μ∼N(0,1).又因为X ¯ ¯ ¯ 是μ的无偏估计,所以|X ¯ ¯ ¯ −μ 0 |不应该很大,即|X ¯ ¯ ¯ −μ 0 |大过某个常数时,就应该拒绝H 0 。拒绝域的形式为|X ¯ ¯ ¯ −μ 0 σ/n √ |≥k.
于是令犯第一类错误的概率为α,即
P{|X ¯ ¯ ¯ −μ 0 |σ/n √ ≥k}=α.
查标准正态分布表可得k=μ α2 ,于是有
P{|X ¯ ¯ ¯ −μ 0 |σ/n √ ≥μ α2 }=α
当|μ|=|X ¯ ¯ ¯ −μ 0 |σ/n √ 的取值大于μ α2 时就应该拒绝H 0 ,否则接受H 0
现在μ 0 =100,σ=0.5,n=9,x ¯ =19 ∑ i=1 9 x i =99.52,μ α2 =1.96.
|μ|=|X ¯ ¯ ¯ −μ 0 |σ/n √ =|99.52−100|0.5/9 √ =2.88>1.96
所以拒绝H 0 ,即认为这段时间内包装机的工作不正常.
参数检验的一般步骤:
1.根据问题的要求,提出原假设H 0 和备择假设H 1 ;
2.给出显著水平α及样本容量n;
3.在H 0 正确下确定检验统计量T及拒绝域的形式;
4.按犯第一类错误的概率等于α求出拒绝域W;
5.根据样本值计算T的观察值t,当t∈W时,拒绝H 0 ,否则接受H 0 .
三、双边假设与单边检验
在备择假设H 1 :μ≠μ 0 中,μ可能不大于μ 0 ,也可能小于μ 0 ,称H 1 为双边备择假设,相应的检验称为双边检验.如果对假设H 0 :μ=μ 0 ,H 1 :μ>μ 0 进行检验称为右边检验.如果对假设H 0 :μ=μ 0 ,H 1 :μ<μ 0 进行检验称为左边检验.右边检验的拒绝域为t≥k,左边检验的拒绝域为t≤k.
例2.某工厂生产的固体燃料推进器的燃烧率服从正态分布N(μ,σ 2 ),μ=40cm/s,σ=2cm/s,现在用新方法生产了一批推进器,从中抽取n=25只,测得样本均值为x ¯ =41.25cm/s.设在新方法下总体的标准差仍为σ=2cm/s,问这批新推进器的燃烧率是否较以往生产的推进器的燃烧率有显著提高?取显著性水平α=0.05.
解:μ 0 =40,依题意检验假设为:H 0 :μ=μ 0 (即新方法未提高燃烧率)H 1 :μ>μ 0 (即新方法提高了燃烧率)这是一个右边检验问题,其检验统计量为μ=X ¯ ¯ ¯ −μ 0 σ/n √ ∼N(0,1),拒绝域为μ≥μ α =μ 0.05 =1.645现在μ=x ¯ −μ 0 σ/n √ =41.25−402/25 − − √ =3.125>1.645,即μ的取值落在拒绝域中,所以在显著性水平α=0.05下拒绝H 0 ,接受H 1 ,即认为这批新推进器较以往提高了燃烧率.
§8.2单个正态总体均值与方差的假设检验
一、方差已知时,正态总体均值的假设检验——μ检验
假设总体X∼N(μ,σ 2 ),(X 1 ,X 2 ,⋯,X n )是来自总体X的样本,σ 2 已知,这里要检验的假设是:H 0 :μ≠μ 0 ,H 1 :μ=μ 0 当H 0 成立时,检验统计量μ=X ¯ ¯ ¯ −μ 0 σ/n √ ∼N(0,1).对于给定的显著性水平α,拒绝域为:W={μ||μ|≥μ α2 }类似地可以检验单边假设(见表8−1)上述检验所用统计量服从标准正态分布,称为μ检验法.
例1.一种元件,要求其平均寿命不小于1000h,现在从一批这种元件中随机抽取25件,测得平均寿命为950h,已知这种元件寿命服从σ=100h的正态分布,试在显著性水平α=0.05条件下确定这批元件是否合格.
解:H 0 :μ=1000,H 1 :μ<1000.当H 0 为真时,检验统计量μ=X ¯ ¯ ¯ −1000σ/n √ ∼N(0,1).对于给定的显著性水平α=0.05,查表得μ α =μ 0.05 =1.645,此题是一个左边检验的问题,拒绝域为μ≤−μ α =−1.645现在n=25,σ=100,x ¯ =950.μ=x ¯ −1000σ/n √ =−2.5<−1.645所以拒绝H 0 ,而接受H 1 ,即认为这批元件不合格.
二、方差未知时,正态总体均值的假设检验——t检验
设总体X∼N(μ,σ 2 ),σ 2 未知,(X 1 ,X 2 ,⋯,X n )是来自总体X的样本.这里要检验的是H 0 :μ=μ 0 ,H 1 :μ≠μ 0 我们用S 2 代替σ 2 ,当H 0 为真时,检验统计量T=X ¯ ¯ ¯ −μ 0 S/n √ ∼t(n−1)对于给定的显著性水平α,拒绝域为|t|≥t α2 (n−1)
例2.某车间加工一种零件,要求长度为150mm,今从一批加工后的这种零件中抽取9个,测得长度如下:147,150,149,154,152,153,148,151,155假设零件长度服从正态分布,问这批零件是否合格(取α=0.05)?
解:这里是在总体方差σ 2 未知的情况下,检验假设H 0 :μ=μ 0 =150,H 1 :μ≠150在H 0 成立时,检验统计量T=X ¯ ¯ ¯ −μ 0 S/n √ ∼t(n−1)对于给定的显著水平α=0.05,拒绝域为|t|≥t α2 (n−1)这里n=9,x ¯ =19 ∑ i=1 9 x i =151,s 2 =19−1 ∑ i=1 9 (x i −x ¯ ) 2 =7.5,s=7.5 − − − √ =2.739,t α2 (n−1)=t 0.025 (8)=2.306|t|=x ¯ −μ 0 s/n √ =1.096<2.306所以接受H 0 ,即认为这批零件合格.
三、正态总体方差的假设检验——χ 2 检验
设总体X∼N(μ,σ 2 ),(X 1 ,X 2 ,⋯,X n )为X的样本,给定显著性水平α,
1.当μ已知时,方差σ 2 的假设检验H 0 :σ 2 =σ 2 0 ,H 1 :σ 2 ≠σ 2 0 其中σ 2 0 为已知常数.检验统计量T=1σ 2 0 ∑ i=1 n (X i −μ) 2 ∼χ 2 (n)对于给定的显著水平α,拒绝域为t≤χ 2 1−α2 (n)或t≥χ 2 α2 (n)上述检验的统计量服从χ 2 分布,称此种检验为χ 2 检验,类似地可以进行单边检验(见表8−1)
2.当μ未知时,σ 2 的假设检验H 0 :σ 2 =σ 2 0 ,H 1 :σ 2 ≠σ 2 0 检验统计量T=(n−1)S 2 σ 2 0 ∼χ 2 (n−1)对于给定的显著性水平α=0.1,拒绝域为t≤χ 2 1−α2 (n−1)或t≥χ 2 α2 (n−1)
例3.某厂生产的尼龙纤维的纤度在正常情况下服从正态分布,其标准差σ=0.048,某日抽取5根纤维,测得它们的纤度为:1.32,1.36,1.55,1.44,1.40试问:能否认为这一天尼龙纤维的纤度的标准差σ=0.048(取α=0.1)?
解:这里要检验的假设是:H 0 :σ=0.048,H 1 :=σ≠0.048检验统计量T=(n−1)S 2 0.048 2 ∼χ 2 (n−1)对于给定的显著性水平α=0.1,拒绝域为t≤χ 2 1−α2 (n−1)或t≥χ 2 α2 (n−1)这里χ 2 1−α2 (n−1)=χ 2 0.95 (4)=0.711,χ 2 α2 (n−1)=χ 2 0.05 (4)=9.488,x ¯ =1.414,s 2 =0.0078,t=(5−1)×0.00780.048 2 =13.51>χ 2 0.05 (4).所以拒绝H 0 ,即不能认为这一天尼龙纤度的标准差σ=0.048.
§8.3两个正态总体均值差与方差比的假设检验
设总体X与Y相互独立,X∼N(μ 1 ,σ 2 1 ),Y∼N(μ 2 ,σ 2 2 ),(X 1 ,X 2 ,⋯,X m )与(Y 1 ,Y 2 ,⋯,Y n )分别来自总体X与Y的相互独立的样本.
一、方差已知时,两个正态总体均值差的假设检验——μ检验
设σ 2 1 ,σ 2 2 为已知,要检验的假设为H 0 :μ 1 =μ 2 ,H 1 :μ 1 ≠μ 2 ,也可以写成H 0 :μ 1 −μ 2 =0,H 1 :μ 1 −μ 2 ≠0检验统计量为μ=X ¯ ¯ ¯ −Y ¯ ¯ ¯ σ 2 1 m +σ 2 2 n − − − − − − − − √ ∼N(0,1)对于给定的显著性水平α,查表得μ α2 ,使得P{|μ|≥μ α2 }=α拒绝域为|μ|≥μ α2