教材:王松桂《线性模型引论》
线性回归模型
y = X β + e y = X\beta+e y=Xβ+e
E ( e ) = 0 , C o v ( e ) = σ 2 I E(e)=0,Cov(e)=\sigma^2I E(e)=0,Cov(e)=σ2I
β \beta β 估计 —— LSE:
m i n Q ( β ) = ∣ ∣ e ∣ ∣ 2 = ∣ ∣ y − X β ∣ ∣ 2 = ( y − x β ) T ( y − X β ) min Q(\beta)=||e||^2=||y-X\beta||^2=(y-x\beta)^T(y-X\beta) minQ(β)=∣∣e∣∣2=∣∣y−Xβ∣∣2=(y−xβ)T(y−Xβ)
then β = ( X T X ) − 1 X T y \beta=(X^TX)^{-1}X^Ty β=(XTX)−1XTy
性质:
1.无偏性
2.最小方差性(Gauss-Markov定理):
β
L
S
E
\beta_{LSE}
βLSE是
β
\beta
β唯一的最佳线性无偏估计(BLU)
σ
2
\sigma^2
σ2估计:
记
e
^
=
y
−
X
β
^
=
(
I
−
P
X
)
y
\hat{e}=y-X\hat{\beta}=(I-P_X)y
e^=y−Xβ^=(I−PX)y
其中
P
X
=
X
(
X
T
X
)
−
1
X
T
P_X=X(X^TX)^{-1}X^T
PX=X(XTX)−1XT
定义
σ
2
\sigma^2
σ2的估计为
σ
2
^
=
∣
∣
y
−
X
β
^
2
∣
∣
/
(
n
−
p
)
=
e
^
T
e
^
/
(
n
−
p
)
\hat{\sigma^2}=||y-X\hat{\beta}^2||/(n-p)=\hat{e}^T\hat{e}/(n-p)
σ2^=∣∣y−Xβ^2∣∣/(n−p)=e^Te^/(n−p)、
性质:
σ
^
2
\hat{\sigma}^2
σ^2是
σ
2
\sigma^2
σ2的无偏估计
通常称前者为后者的LS估计
若进一步假设误差向量e服从多元正态分布,
则相应模型为正态线性模型:
y
=
X
β
+
e
,
e
N
(
0
,
σ
2
I
)
y = X\beta+e,e~N(0,\sigma^2I)
y=Xβ+e,e N(0,σ2I)
有如下性质:
(1)LSE
β
^
\hat{\beta}
β^是
β
\beta
β的MLE,且
β
^
\hat{\beta}
β^服从
N
(
β
,
σ
2
(
X
T
X
)
−
1
)
N(\beta,\sigma^2(X^TX)^{-1})
N(β,σ2(XTX)−1)
(2)
n
−
p
n
σ
^
2
\frac{n-p}{n}\hat{\sigma}^2
nn−pσ^2为
σ
2
\sigma^2
σ2的MLE,且
n
−
p
n
σ
^
2
\frac{n-p}{n}\hat{\sigma}^2
nn−pσ^2服从
χ
n
−
p
2
\chi^2_{n-p}
χn−p2
(3)
β
^
\hat{\beta}
β^与
σ
^
2
\hat{\sigma}^2
σ^2相互独立
(4)
β
^
\hat{\beta}
β^是
β
\beta
β的MVUE