假设检验
小概率事件
一次试验中,一个几乎不可能发生的事件发生的概率,小概率由研究者事先确定
假设检验的小概率原理
小概率事件在一次实验中是几乎不可能发生的,如果只通过一个样本,小概率事件就发生了,说明是错误的。也就是说,如果是在原假设成立的条件下,样本落入了拒绝域就成为了一个小概率事件,如果它发生了,就认为原假设错误,从而就拒绝原假设。
对于显著性水平α,如果它越小,说明越难检验,这个时候如果还能检验出来就说明更加具有说服力,所以显著性水平越小就说越显著。
在统计学上,拒绝零假设、统计上显著的、该统计量值落在拒绝域上都是一个意思。
H0假设:零假设 我们通常是希望拒绝它的
H1假设:备择假设 我们想得到的假设
例如:我希望证明 明天下雨,那么明天下雨就是一个备择假设,明天不下雨就是一个零假设。
假设检验的方法
1.置信区间法
1-α为置信度。例如,要对β2进行假设检验,首先构造一个置信区间,若β2在假设H0下,落入此区间就接受,否则就拒绝(小概率事件发生了)
[
β
^
2
−
t
α
/
2
s
e
(
β
^
2
)
,
β
^
2
+
t
α
/
2
s
e
(
β
^
2
]
[\hat\beta_2-t_{\alpha/2}se(\hat\beta_2),\hat\beta_2+t_{\alpha/2}se(\hat\beta_2]
[β^2−tα/2se(β^2),β^2+tα/2se(β^2]
假设H0:β2=0.3,落在了区间(0.4268,0.5614)外,则拒绝原假设。
上述是双侧检验,单侧检验也是同理。
2.显著性检验法
与置信区间法的区别与联系:
置信区间中,试图建立一个以某种概率包含有真实但位置的β2的一个区间。
显著性检验中,假设β2为某值,然后看
β
^
2
\hat\beta_2
β^2是否位于该假设值周围的合理范围内。
例1:t 检验
t
=
(
β
^
2
−
β
2
)
/
s
e
(
β
^
2
)
t=(\hat\beta_2-\beta_2)/se(\hat\beta_2)
t=(β^2−β2)/se(β^2)
[
β
2
∗
−
t
α
/
2
s
e
(
β
^
2
)
,
β
2
∗
+
t
α
/
2
s
e
(
β
^
2
]
[\beta^*_2-t_{\alpha/2}se(\hat\beta_2),\beta^*_2+t_{\alpha/2}se(\hat\beta_2]
[β2∗−tα/2se(β^2),β2∗+tα/2se(β^2]
1.判断
β
^
2
\hat\beta_2
β^2
如果落在拒绝域,则就拒绝真实β2=0.5的虚拟假设。
2.判断临界值
判断t值是否在
(
−
t
α
/
2
,
t
α
/
2
)
(-t_{α/2},t_{α/2})
(−tα/2,tα/2),不是就拒绝。
例2:卡方检验
注意该分布不对称
给定显著性水平与自由度df,查表得到临界点
χ
α
/
2
2
(
d
f
)
\chi^2_{α/2}(df)
χα/22(df)和
χ
1
−
α
/
2
2
(
d
f
)
\chi^2_{1-α/2}(df)
χ1−α/22(df)。如果落在拒绝域中就拒绝。
精确的显著性水平—P值
经典的假设检验方法的痛处就在于选择α时候的武断性。但是如果我们用给定的样本算出一个检验统计量的时候,如果知道得到一个和样本得到的检验统计量那样大或者更大的数值的确切概率,这个概率就是P值。
例如 我们有t=1.47 p=0.12
在5%、10%水平下不能拒绝零假设。但是在15%的水平下可以拒绝零假设。
可以给定一个α,判断p值与α的大小,如果p<α,就应该拒绝。
第一类错误
统计学上把原假设H0为真而拒绝原假设称为犯了第一类错误。
如果我们人为地规定低于5%的事件是小概率事件,在一次试验中不会发生,那么我们就注定了会有5%的可能性犯错,因为人为规定的那些小概率事件在现实中是可能发生的,而发生的概率就是我们规定的5%,即犯错的概率便等于小概率事件发生的概率。
我们尽可能使α小。