UA STAT687 线性模型II 最小二乘理论1 普通最小二乘法

最新推荐文章于 2024-09-21 14:55:44 发布

一个不愿透露姓名的孩子

最新推荐文章于 2024-09-21 14:55:44 发布

阅读量507

点赞数

分类专栏： # 线性模型文章标签：统计学线性模型机器学习

本文链接：https://blog.csdn.net/weixin_44207974/article/details/108374185

版权

本文深入探讨了线性模型中的最小二乘法，包括参数的OLS估计、Gauss-Markov定理及其证明。阐述了OLS估计在不同秩条件下的性质，证明了OLS估计是最优线性无偏估计(BLUE)，并介绍了方差的OLS估计以及正态线性模型下的统计推断特性。

摘要由CSDN通过智能技术生成

Legendre与Gauss在19世纪初提出了最小二乘的思想，1900年Markov证明了最小二乘估计的性质良好，在此之后最小二乘就开始广泛应用于线性模型的估计了。对于线性模型
$y=X\beta + \epsilon,E\epsilon=0,Cov(\epsilon)=\sigma^2I$

其中 $y,\epsilon$ 为 $n\times 1$ 的向量， $X$ 为 $\times p$ 的Design Matrix，如果 $rank(X)\ge p$ ，称这个线性模型为满秩的；否则称之为降秩的。这部分我们将介绍普通最小二乘法（OLS）、带约束的最小二乘法、广义最小二乘法（GLS）、稳健性、两步法、最小二乘法的几何解释以及常用数值算法，这一篇介绍OLS。

参数的OLS估计

OLS的思路是
$\min_{\beta}\ \ Q = \left\| e \right\|^2 = (y-X\beta)'(y-X\beta)=y'y-2y'X\beta+\beta'X'X\beta$

计算 $Q$ 关于 $\beta$ 的梯度
$\nabla_{\beta} Q=-2X'y+2X'X\beta=0 \Rightarrow X'X\beta = X'y$

这个方程叫做OLS的正则方程，求解这个方程可以得到系数的OLS估计，并且基于这个方程还可以获得残差的性质。 $X^{'} y$ 在 $X^{'}$ 的列空间中，因此这个方程是相容的，可以用系数矩阵的广义逆表示解：
$\hat{\beta} = (X'X)^{-}X'y$

计算 $Q$ 关于 $\beta$ 的Hessian矩阵，
$H_{\beta}Q = 2X'X\ge 0$

因此 $\hat{\beta}$ 使 $Q$ 取最小值，并且最小值点唯一。

下面考虑广义逆的确定。假设 $rank(X)\ge p$ ，则 $X^{'} X$ 是满秩的方阵，
$\hat{\beta} = (X'X)^{-1}X'y$

假设 $r a n k (X) < p$ ，则 $X^{'} X$ 降秩，它的逆不存在，此时不存在 $\beta$ 的线性无偏估计。
证明
假设 $A y$ 是线性无偏估计，则 $AX\beta = \beta \Rightarrow AX = I_p \Rightarrow rank(AX)=p$ ，然而