Y∼N(μ,δ2)
a+CY∼N(a+cμ,c2δ2)
一、 β0,β1 推导
对 β1 的推导
β^1=∑ni=1(xi−x¯)Yi∑ni=1(xi−x¯)2=∑ni=1kiYiE(β^1)=β1
Var(β^1)=δ2∑ni=1(xi−x¯)2
其中通常标记 Sxx=∑ni=1(xi−x¯)2
β^1∼N(β1,δ2∑ni=1(xi−x¯)2)
β^1−β1sd(β^1)∼N(0,1)
通常,我们是无法获得标准差的,不过我们可以通过MSE来获得beta_1的standard error,在(1)中有提过经常使用
δ^=MSE−−−−−√
,即用MSE来作为标准差的估计量,而且MSE也是方差的无偏估计量。
se(β^1)=δ2∑ni=1(xi−x¯)2−−−−−−−−√
se(β^1)=MSE∑ni=1(xi−x¯)2−−−−−−−−√
β^1−β1se(β^1) 的样本分布
此处需要补充卡方分布,t分布的概念:
卡方分布:若k个随机变量 Z1,...,Zk 是相互独立,符合标准正态分布的随机变量,则随机变量Z的平方和 X=∑ki=1Z2i 被称为服从自由度为k的卡方分布。
t分布:t分布可以表示为 Zwv√ ,其中Z服从标准正态分布, w∼χ2v 而且Z和w相互独立
(n−2)se2(β^1)sd2(β^1)=(n−2)MSEδ2=SSEδ2∼χ2n−2
β^1−β1se(β^1)=(β^1−β1)/sd(β^1)se(β^1)/sd(β^1)=Zχ2n−2n−2√∼tn−2
β^1−β1se(β^1)∼tn−2
随后的所有置信区间,假设检验,概率区间都是基于t分布。
1.zhixin qujian
Tables | p-value | Reject Region |
---|---|---|
Two-sided | P(|T|≥|t∗|) | |t∗|>t1−α/2,n−2 |
right-tailed | P(T>t∗) | t∗>t1−α/2,n−2 |
left-tailed | P(T<t∗) | t∗<t1−α/2,n−2 |