专栏里有一篇”两类错误弃真与取假“对显著性水平
首先我们要清楚我们手上只有一份容量为
> a = rnorm(10)
> a
[1] 1.5947535 0.5916560 -1.4030615 0.8350419 0.3275434 -0.1774061
[7] 0.3069998 0.8080916 0.9208237 1.7238498
> mean(a)
[1] 0.5528292
> a = rnorm(10)
> a
[1] 0.35033956 -0.02736848 -1.49906577 2.46780054 -0.17857308 1.40162005
[7] 0.86463818 -0.53841337 -1.41811231 -1.93739658
> mean(a)
[1] -0.05145313
上面抽了两份样本,对期望进行点估计,如果我们获得的是第一份样本估计为0.55,如果是第二份估计为-0.05。即不同的一份样本会得到不同的点估计,如果运气不佳获得一份更为极端的样本,推断也就更离谱,这也是为什么需要区间估计。
回到本文,通常用统计量来进行估计如
[1]P-值的计算
如使用下面这份样本针对期望进行假设检验时,
> a
[1] -0.97203553 0.50476131 -0.06238007 0.20314828 -2.07270428 -0.40954420
[7] -0.77950116 0.67592430 -0.06361145 -0.02983502
假设检验问题可取为
用
根据这份样本计算样本的统计量
> mean(a)
[1] -0.3005778
即假设原假设成立时,从分布
一个问题是连续分布在一点处是没有概率的,于是使用累积概率来判断,如
> 2*pnorm(-0.3,0,1/sqrt(10))
[1] 0.3427817
一般P-值小于0.05就认为使得这个随机数发生的概率很小。上面的P-值为0.34,故不拒绝原假设。
与P-值对应的概念就是显著性水平
> qnorm(0.025,0,1/sqrt(10))
[1] -0.619795
拒绝域为
[2]第二类错误的计算
把问题设为
假设原假设成立,获得分布
如果
如果
注意,使用原假设获得分布
使用上面计算过的拒绝域,得接受域为(-0.62,0.62),计算第二类错误,
> 1 - 2*pnorm(-0.62,1,1/sqrt(10)) #使用N(1,1/10)分布计算
[1] 0.9999997
> 1 - 2*pnorm(-0.62,0.1,1/sqrt(10)) #改个和原假设更近的备择假设,第二错误更大
[1] 0.9772042
从上面的分析过程也可以看到如果让
[3]功效的比较
控制第一类错误
问题为
上面使用统计量
- 从上面的计算可以看到
的对应的拒绝域、第二类错误为,
- 关于
的对应的拒绝域、第二类错误为,
> qnorm(0.025,0,sqrt(10)/9)
[1] -0.6886611
拒绝域为
备择假设的分布为
> 1 - 2*pnorm(-0.69,1/9,sqrt(10)/9)
[1] 0.9773924
我们控制了第一类错误,即两个统计量的第一类错误均为0.05。但可以看到
所以有时我们希望找某个假设检验功效(1-第二类错误概率)最好的统计量。
在以后学习统计模型,需要比较各种模型的好坏时,对于不同的模型,先使用符合原假设产生的模拟数据计算及比较P-值,P-值越小越不易犯第一类错误模型越好;再使用备择假设产生的模拟数据计算及比较功效
计算也很简单,原假设备择假设均模拟10000次,使用原假设的数据 P-值=拒绝次数/10000;使用备择假设的数据,功效=1-(接受的次数/10000)