数学基础-概率论04(统计推断-参数假设检验)

1222446-20181225172947006-2041970394.png

4.参数假设检验

统计推断的另一类重要的问题是假设检验,所谓假设检验就是对总体分布中的某个参数或者分布的形式作出某种假设,利用抽取样本提供的信息,构造适合的统计量,再根据小概率事件进行检验,以作出统计推断。

常用的假设检验方法有U检验法,t检验法,1222446-20181225172947389-623949756.png检验法,F检验法

名词解释:
原假设与备择假设:把检验的假设称为原假设;把原假设的对立面称为备择假设

显著性检验与显著性水平:假设检验有两类错误,分别是:1222446-20181225172947688-302698312.png1222446-20181225172948022-387490121.png,通常显示1222446-20181225172948287-18087867.png的最大上界而不考虑1222446-20181225172948820-689392525.png的问题称为假设检验,并将1222446-20181225172949218-1694376865.png的最大上界称为假设检验的显著性水平。

双侧边假设检验与单侧边假设检验:针对原假设的假设形式而言,具体查资料,不详细说明。

拒绝域与临界点:拒绝域是统计量的范围,临界点是拒绝域的边界。

假设检验一般步骤:
(1)提出假设:提出原假设1222446-20181225172951004-1229125891.png和备择假设1222446-20181225172951379-984665745.png
(2)建立合适的统计量,选择检验统计量并确定其分布
(3)确定拒绝域:现给定的显著性水平下,确定1222446-20181225172951991-1248895187.png关于统计量的拒绝域
(4)计算:计算样本点对于统计量的值
(5)判断:若统计量落在拒绝域内,则拒绝1222446-20181225172952394-439232342.png,否则接受1222446-20181225172952809-11724868.png

假设检验原理图示:
先来看看前一章参数估计的套路:

标准正态分布的概率密度函数
标准正态分布的概率密度函数

对于给定的置信度1222446-20181225172953111-1025148919.png,我们算得统计量1222446-20181225172953421-1672526168.png,并由此得出未知参数的置信区间。图中的2加3为置信区间。

对于假设检验,给定显著性水平(即为置信区间中的1222446-20181225172953741-303527896.png),构造统计量后,代入具体一次抽样的数据和假设条件,如果统计量的值在图中2加3的区域下,说明该次抽样是发生在大概率的条件下,则接受假设条件,否则统计量落在3加4的区域内,拒绝假设条件。通常3加4区域为拒绝域,1加2为接受域,依据统计量落的范围决定接受/拒绝假设条件。


4.1 单个正态总体参数的假设检验

4.1.1 单个正态总体均值检验

(1)方差1222446-20181225172954028-1536560093.png已知
当方差1222446-20181225172954230-885814121.png已知,给定显著性水平1222446-20181225172954437-2115060977.png,假设1222446-20181225172954669-52458462.png,其拒绝域为:

1222446-20181225172954957-390524309.png

其中1222446-20181225172955154-603876415.png,1222446-20181225172955371-1101287061.png1222446-20181225172955684-2045997381.png来自样本,1222446-20181225172955976-483333806.png是假设。

所以说,上面统计量在某个抽样和假设下的值是可以算出来的,如果该值满足上面的式子(即落在拒绝域内),则拒绝假设1222446-20181225172956176-1936453756.png

例子:

检验牛奶是否加水,牛奶冰点温度近似满足正态分布,加水会导致该冰点温度升高,其均值方差分别为-0.545和0.008,现抽样5批牛奶,得到均值为-0.534,问这批牛奶是否加水,取显著性水平为0.05.
首先提出假设: 1222446-20181225172956382-2024623217.png
1222446-20181225172956596-465816801.png
已知统计量为:1222446-20181225172956895-1901338624.png
已知拒绝域为:1222446-20181225172957203-2070963731.png
依据抽样数据和假设条件可算得统计量值1222446-20181225172957414-1894134481.png,即统计量落在拒绝域内,所以拒绝1222446-20181225172957616-132375938.png,即认为牛奶加水了。

注:这种利用标准正态分布的统计量进行检验的方法称为:U检验法

(2)方差1222446-20181225172957819-1837000453.png未知
在方差未知的情况下,使用样本的方差进行分析,可构造其统计量为:

1222446-20181225172958025-1916416042.png

拒绝域为:

1222446-20181225172958238-1711495593.png

例子

工业废水中,某有害物质含量不超过0.5,现抽样5次,其结果为:0.53,0.542,0.51,0.495,0.515,问抽样结果能说明该废水该有害物质含量是否超标,取显著性水平为0.1
首先提出假设: 1222446-20181225172958651-1760429358.png
1222446-20181225172958955-1925492531.png
已知统计量为:1222446-20181225172959460-802711917.png
已知拒绝域为:如果是双边假设检验是:1222446-20181225172959773-818350705.png,但是该问题是单边的假设检验,只需要考虑正值的一边,查t分布可知,在正值一边的临界点是1222446-20181225173000071-1789997620.png
依据抽样数据和假设条件可算得统计量值1222446-20181225173000267-1203399360.png,即统计量落在拒绝域内,所以拒绝1222446-20181225173000489-816456894.png,即认为有害物质超标。

注:这种利用t分布的统计量进行检验的方法称为:t检验法


4.1.2 单个正态总体方差检验

设X-N(1222446-20181225173000785-1345009492.png),抽样一组数据,得到其均值和方差为1222446-20181225173001094-1103021589.png,有以下假设:
$$
原假设:1222446-20181225173001528-100409395.png; 备择假设:1222446-20181225173001739-1134013327.png,其中1222446-20181225173001930-2011521636.png为已知常数。

可知:

1222446-20181225173002135-1301032113.png

给定显著性水平\alpha,得到以下拒绝域:

1222446-20181225173002426-540000561.png
1222446-20181225173002630-975570546.png

例子:

已知纺纱厂的支数满足正态分布,某种细纱的标准差为1.2,现抽样16个样本,测的其中的标准差为2.1,问该批次细纱较平时均匀度有无变化?取显著性水平为0.05
解:
提出假设: 原假设:1222446-20181225173002938-852688793.png; 备择假设:1222446-20181225173003374-1468175731.png
拒绝域为:1222446-20181225173003658-2097352074.png1222446-20181225173004020-294164817.png
样本的统计量值为:1222446-20181225173004270-1465905025.png >样本统计量值在拒绝域内,即拒绝原假设,认为该批次细纱较平时均匀度有显著性变化


4.2 两个正态总体参数的假设检验

4.2.1 两个正态总体均值差检验

(1)方差1222446-20181225173004576-306803418.png已知
提出假设:1222446-20181225173004787-1959298054.png,其中1222446-20181225173005194-1728271344.png已知
1222446-20181225173005378-964546357.png为真时:

1222446-20181225173005607-1792743658.png

给定显著性水平1222446-20181225173005908-757753086.png,拒绝域为:

1222446-20181225173006322-231960107.png

(2)方差1222446-20181225173006652-1061271703.png已知,并且1222446-20181225173006932-929394709.png
提出假设:1222446-20181225173007117-382418157.png,其中1222446-20181225173007460-1937567907.png已知
1222446-20181225173007752-1107063069.png为真时:

1222446-20181225173008040-1754810633.png

给定显著性水平1222446-20181225173008470-17399209.png,拒绝域为:

1222446-20181225173008765-2035428275.png

4.2.2 两个正态总体方差相等的假设检验

假设有1222446-20181225173009291-938780559.png两个正态分布,从其中各抽样一次,算得样本方差为1222446-20181225173009520-1104941659.png

提出假设:1222446-20181225173009805-859145755.png
1222446-20181225173010021-497063023.png为真时:

1222446-20181225173010313-866981789.png

给定显著性水平1222446-20181225173010620-1276977782.png,拒绝域为:

1222446-20181225173010940-1024542404.png1222446-20181225173011123-2086127961.png

说明
本教程是在学习书籍新编概率论与数理统计-孙淑娥基础上所写的。

转载于:https://www.cnblogs.com/wushaogui/p/9981632.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值