t检验
t检验是假设检验的一种方式,统计推断中包括点估计、假设检验、区间估计、预测。之前做的对回归方程中的系数的OLS估计就属于点估计,而假设检验就是,我们给出一个假设,然后通过对样本数据的处理,来判断这个假设是否成立。
在这里t检验是用来检验我们估计的β hat是不是靠谱,在统计上我们描述为“是否显著”,这里“显著”指的是“显著不为0”,如果
显著不为0,那么对应的解释变量
对y的作用就是可靠的,而“不显著”在统计意义上就是,可以视作0,那么对应的
对y就是无作用的。
至于t检验如何来判断β hat是否显著,我们需要先了解“假设检验”是如何判断它的假设是否成立的。
假设检验
假设检验其实是一种概率上的反证法。我们先有一个原假设,在原假设成立的情况下,如果在一次抽样实验中观测到了小概率事件的发生,那我们倾向于认为这个原假设是不该成立的,我们会拒绝它,接受“备择/替代假设”。
比如,我们有一箱子小球,共1000个,我们设立原假设为:1000个小球中只有5个是红色,其余的都是白色。在这个假设下,“抽到红色小球”就是一个小概率事件。我们进行随机抽样,抽到了一个红色小球,那我们就倾向于认为,这个箱子里不只有5个红色小球,也就是,原假设是不成立的。
在对我们估计的系数
进行假设检验时,我们的原假设为:
:
=c
c是任意给定的一个常数,是我们对
的假想值,我们一般将它设为0。如果经过检验,我们拒绝了原假设,就称为
“显著地不为0”,简单称为“显著”。
能让我们拒绝原假设
=c的,就是我们得到了
=c条件下的小概率事件,也就是,我们以抽样数据估计出的
离c很远,那到底多远就能判定为小概率?并且,这个小概率有多“小”?
一般我们把这个概率临界值α设定为5%,称其为“显著性水平”。也就是,发生了在
=c的条件下概率小于5%的事件,都可以拒绝原假设,判定
为显著。有时我们也采用α=1%或者α=10%。
那么要找到这个≤5%的概率水平下,
的取值