统计推断——假设检验——检验的功效(势)

一、假设检验的两类错误:

第Ⅰ类错误:实际情况与\large H_{0} 一致时,却根据统计量数值拒绝\large H_{0},这样的错误称为第Ⅰ类错误;出现第Ⅰ类错误的概率用\large \alpha表示。

第Ⅱ类错误:实际情况与\large H_{0}不一致时,却根据统计量数值不拒绝\large H_{0},这样的错误称为第Ⅱ类错误;出现第Ⅱ类错误的概率用\large \beta表示。

二、假设检验的两类错误为什么不能同时变小?

假如理论告诉我们参数\large \mu只可能在0和1之间取值,检验统计量服从\large N(\mu ,1^{2})分布。检验统计量可取值于整个\large R,我们想要划分\large R\large R_{0}\large R_{1},使得落在\large R_{0}时接受\large H_{0}\large \mu =0的假设,而落在\large R_{1}时接受\large H_{1}\large \mu =1的假设。

现在问题是如何划分\large R_{0}\large R_{1}。事实上不同的原则可以导出不同的划分方法,其中每一个都是不同的检验。其中每种检验都对应相应的的第一类第二类错误概率值,所谓第一类第二类错误值不能同时减小,指的就是在这一阶段不可能通过单纯改变\large R_{0}\large R_{1}的划分方式来同时降低两类错误概率。

至于为什么这一阶段不可能通过改变\large R_{0}\large R_{1}划分来降低两类错误概率,由下图所示:

若以1/2为分隔点,当检验统计量落在其左边接受\large H_{0}\large \mu =0落在右边时接受\large H_{1}\large \mu =1

\large \mu的确为0时,即\large H_{0}\large \mu =0假设正确时,错误概率为落在1/2右边的概率(第一类错误发生的概率\large \alpha)。如下图所示:

\large \mu的确为1时,错误概率(第二类错误发生的概率\large \beta)为落在1/2左边,如下图所示: 

将分割线移到0时,\large H_{0}\large \mu =0错误率升为 

此时,\large H_{1}\large \mu =1时错误率降为 

由以上分析可获结论:对于某一具体的检验来说,当样本量\large n一定时, \large \alpha越小 \large \beta 越大,\large \alpha越大 \large \beta越小。 

三、检验的功效

\large H_{0}实际上不成立时,根据统计量的数值拒绝\large H_{0}, 做对了!这样的概率,称为检验功效(power of test),记为\large 1-\beta

检验功效的意义:当两个总体参数的确存在差异时,所使用的统计检验能够发现这种差异的概率。 

例 如果\large 1-\beta =  0.90,则意味着当\large H_{0} 实际上不成立时,理论上在每100次检验中,平均有90次能拒绝\large H_{0}

单样本设计资料t 检验的功效

例  已知北方地区一般儿童前囟门闭合月龄的均值为14.1,某研究人员从东北某缺钙地区抽取36名儿童,得前囟门闭合月龄均值为14.3,标准差为5.08。问该县儿童前囟门闭合月龄是否大于一般儿童的前囟门闭合月龄? 

分析:根据医学专业知识,缺钙地区不会闭合得更快,但有可能闭合得慢些,故可作单侧检验。

结论:经\large t假设,得\large t=0.236,\large P>0.05,不拒绝\large H_{0}。 

但是以上的结论也可能样本量小, 检验的功效不够大导致的,所以我们要计算该检验的功效\large 1-\beta

功效计算公式

\large Z_{\beta }=\frac{\sqrt{n}\delta }{\sigma }-Z_{\alpha }

\large n : 样本量 

\large \delta : 欲发现的最小差异(或容许误差) 

\large \sigma: 总体标准差; 

\large Z_{\alpha }: 标准正态分布的临界值。单侧检验时取单侧临界值; 双侧检验时取双侧临界值

\large Z_{\beta }: 标准正态分布的单侧临界值(永远是一个单侧的临界值,即标准正态分布上侧尾部面积为\large \beta所对应的那个临界值)。

算得\large Z_{\beta }后,反查标准正态分布表来确定\large \beta,进而得到\large 1-\beta

根据现有知识,\large \delta= 0.5月,\large \sigma = 5月,  \large Z_{\alpha }=1.645 (单侧)

\large Z_{\beta }=\frac{\sqrt{n}\delta }{\sigma }-Z_{\alpha }=\frac{\sqrt{36}\times 0.5}{5}-1.645=-1.045

由标准正态分布表查得\large \beta= 0.8531,\large 1-\beta= 0.1469 欲发现\large \delta= 0.5 月的差别,概率只有 14.69%,检验功太小! 

三、影响检验功效的主要因素 

1、参数间(两均数\large \mu _{0}\large \mu _{1})差异越大,功效越大 

2、个体差异越小,功效越小 

3、样本量越大,功效越大(样本量小曲线较胖,样本量大曲线较瘦) 

4、\large \alpha越大,功效越大 

在假设检验结果的解释和评价中,特别是分析那些未能拒绝 \large H_{0}的假设检验结果,事后估计\large 1-\beta的值,有助于判断是总体的参数确实没有差别,还是由于样本量太小,而导致检验效能不足,如\large 1-\beta< 80%。  

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

xia ge tou lia

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值