在前面的基础上,我们要对参数的估计值等做统计检验,还需要另一项假设就是,干扰项必须符合正态分布
但是由于有中心极限定理,只要样本数量够多,就可以近似看做正态分布 anyway,正态分布必须成立即
然后这条归纳式就很形象
就是说这个y在x的条件下是符合这个分布的,就是说我们统计分布中不确定的地方就是来自于这个u
之后是一个考试的重点,应该是吧
OLS估算量的抽样分布
由于之前的计算式,和前面的七个假定,我们可以推出,参数估计量是y的线性函数,那么唯一影响y的不确定性的就是u,既然u服从正态,则OLS估计量也符合正态分布
有
在 σ 确定的情况下,我们有
但是呢大多数时候这个
σ
我们是不知道的
所以我们用之前求出的
σ^
来估计它,之后我们就有这个
Var(β^k)
是符合
χ2
分布的
所以根据T分布定义
检验量=N(0,1)χ2(n−K−1)−−−−−−−−−−−√∼Tn−K−1
所以
T分布是重点!!!!!!
所以我们要对真实参数
βk
进行假设检验的时候,就拿出t值(这里要注意是单尾检验还是双尾检验),然后根据检验量求出真实参数的取值范围
双尾检验,就是检验是否相等:
单尾检验就是检验大小关系:
但是比较常见的就是检验相关性了,就是是否为零:
PS:一般来说都是为了拒绝原假设的,因为拒绝比不能反对更有说服力。
然后还有一种是显著性检验,就是直接算出检验子t,和 tα/2,or,α 比较,如果 |t|>tα/2,or,α ,就拒绝原假设
to be continue…