多元线性回归

最新推荐文章于 2022-11-28 20:19:40 发布

_OscarLi

最新推荐文章于 2022-11-28 20:19:40 发布

阅读量217

点赞数

分类专栏：实用回归分析文章标签：回归分析

本文链接：https://blog.csdn.net/weixin_42830365/article/details/110919827

版权

实用回归分析专栏收录该内容

3 篇文章 0 订阅

订阅专栏

多元线性回归

$y=\left[\begin{array}{c} y_{1} \\ y_{2} \\ \vdots \\ y_{n} \end{array}\right], X=\left[\begin{array}{cccc} 1 & x_{11} & \cdots & x_{1 p} \\ 1 & x_{21} & \cdots & x_{2 p} \\ \vdots & \vdots & & \vdots \\ 1 & x_{n 1} & \cdots & x_{n p} \end{array}\right], \epsilon=\left[\begin{array}{c} \epsilon_{1} \\ \epsilon_{2} \\ \vdots \\ \epsilon_{n} \end{array}\right], \beta=\left[\begin{array}{c} \beta_{0} \\ \beta_{1} \\ \vdots \\ \beta_{p} \end{array}\right]$

$\boldsymbol{y}=\boldsymbol{X} \boldsymbol{\beta}+\varepsilon$

$\boldsymbol{X}=\left(\mathbf{1}, \boldsymbol{x}_{1}, \ldots, \boldsymbol{x}_{p}\right)-- n \times(p+1)$

$\varepsilon=\left(\varepsilon_{1}, \ldots, \varepsilon_{n}\right)^{\prime}$

Gauss-Markov条件:
$\left\{\begin{array}{l} E\left(\varepsilon_{i}\right)=0, i=1, \ldots, n \\ \operatorname{Cov}\left(\varepsilon_{i}, \varepsilon_{j}\right)=0, i \neq j ; \quad \operatorname{Var}\left(\varepsilon_{i}\right)=\sigma^{2} \end{array}\right.$

正态性假设:
$\left\{\begin{array}{l} \varepsilon_{i} \sim N\left(0, \sigma^{2}\right), i=1, \ldots, n \\ \varepsilon_{1}, \ldots, \varepsilon_{n} \quad \text { 相互独立 } \end{array}\right.$

LSE

$Q(\boldsymbol{\beta})=(\boldsymbol{y}-\boldsymbol{X} \boldsymbol{\beta})^{\prime}(\boldsymbol{y}-\boldsymbol{X} \boldsymbol{\beta})$

$\frac{\partial Q(\boldsymbol{\beta})}{\partial \boldsymbol{\beta}}=-\boldsymbol{X}^{\prime} 2(\boldsymbol{y}-\boldsymbol{X} \boldsymbol{\beta})=-2 \boldsymbol{X}^{\prime}(\boldsymbol{y}-\boldsymbol{X} \boldsymbol{\beta})=0$

$\hat{\boldsymbol{\beta}}=\left(\boldsymbol{X}^{\prime} \boldsymbol{X}\right)^{-1} \boldsymbol{X}^{\prime} \boldsymbol{y}$

$\hat{\boldsymbol{y}}=\boldsymbol{X} \hat{\boldsymbol{\beta}}=\boldsymbol{X}\left(\boldsymbol{X}^{\prime} \boldsymbol{X}\right)^{-1} \boldsymbol{X}^{\prime} \boldsymbol{y} \stackrel{\text {def}}{=} \boldsymbol{H} \boldsymbol{y}$

$H=X(X'X)^{-1}X'\rightarrow H^2=X(X'X)^{-1}X'*X(X'X)^{-1}X'=X(X'X)^{-1}X'=H$

$I_n-H)^2=I_n^2-2HI_n+H^2=I_n-H$

Resid

$\boldsymbol{e}=\boldsymbol{y}-\hat{\boldsymbol{y}} \text { 为 } \boldsymbol{y} \text { 的残差向量，将 } \hat{\boldsymbol{y}}=\boldsymbol{H y} \text { 代入 }$

$\boldsymbol{e}=\boldsymbol{y}-\boldsymbol{H} \boldsymbol{y}=(\boldsymbol{I}-\boldsymbol{H}) \boldsymbol{y}$

$\begin{aligned} D(\boldsymbol{e}) &=\operatorname{Cov}(\boldsymbol{e}, \boldsymbol{e}) \\ &=\operatorname{Cov}((\boldsymbol{I}-\boldsymbol{H}) \boldsymbol{y},(\boldsymbol{I}-\boldsymbol{H}) \boldsymbol{y}) \\ &=(\boldsymbol{I}-\boldsymbol{H}) \operatorname{Cov}(\boldsymbol{y}, \boldsymbol{y})(\boldsymbol{I}-\boldsymbol{H})^{\prime} \\ &=(\boldsymbol{I}-\boldsymbol{H}) \sigma^{2} \boldsymbol{I}(\boldsymbol{I}-\boldsymbol{H})^{\prime} \\ &=\sigma^{2}(\boldsymbol{I}-\boldsymbol{H}) \end{aligned}$

$\operatorname{Var}\left(e_{i}\right)=\left(1-h_{i i}\right) \sigma^{2}, i=1, \ldots, n$

$\hat{\beta}$ 为无偏估计
$\begin{aligned} E(\hat{\boldsymbol{\beta}}) &=E\left\{\left(\boldsymbol{X}^{\prime} \boldsymbol{X}\right)^{-1} \boldsymbol{X}^{\prime} \boldsymbol{y}\right\} \\ &=\left(\boldsymbol{X}^{\prime} \boldsymbol{X}\right)^{-1} \boldsymbol{X}^{\prime} E \boldsymbol{y} \\ &=\left(\boldsymbol{X}^{\prime} \boldsymbol{X}\right)^{-1} \boldsymbol{X}^{\prime} \boldsymbol{X} \boldsymbol{\beta}=\boldsymbol{\beta} \end{aligned}$

$D(\hat{\boldsymbol{\beta}})=\sigma^{2}\left(\boldsymbol{X}^{\prime} \boldsymbol{X}\right)^{-1}$

exer

$Proof:\hat{\sigma}^{2}=\frac{1}{n-p-1} \sum_{i=1}^{n} e_{i}^{2}=\frac{1}{n-p-1} \boldsymbol{e}^{\prime} \boldsymbol{e}$

$E\left(\sum_{i=1}^{n} e_{i}^{2}\right)=\sum_{i=1}^{n} D\left(e_{i}\right)$

$E\left(\sum_{i=1}^{n} e_{i}^{2}\right)=\sum_{i=1}^{n} D\left(e_{i}\right)=\sum_{i=1}^{n} \sigma^{2}\left(1-h_{i i}\right)=\sigma^{2} \sum_{i=1}^{n}\left(1-h_{i i}\right)=\sigma^{2}\left(n-\sum_{i=1}^{n} h_{i i}\right)=\sigma^{2}(n-p-1)$

$\begin{array}{l} \operatorname{diag}(\boldsymbol{H})=\left(h_{11}, \ldots, h_{n n}\right) \\ \operatorname{tr}(H)=\sum_{i=1}^{n} h_{i i}=\operatorname{tr}\left(\boldsymbol{X}\left(\boldsymbol{X}^{\prime} \boldsymbol{X}\right)^{-1} \boldsymbol{X}^{\prime}\right)=\operatorname{tr}\left(\left(\boldsymbol{X}^{\prime} \boldsymbol{X}\right)^{-1} \boldsymbol{X}^{\prime} \boldsymbol{X}\right)=p+1 \end{array}$

$计算\operatorname{Cov}(\boldsymbol{e}, \hat{\boldsymbol{\beta}})\rightarrow \hat{\sigma}^{2} 与\hat{\beta}的独立性$

$\begin{array}{l} \operatorname{cov}(\hat{\beta}, e)=\operatorname{cov}\left(\left(X^{T} X\right)^{-1} X^{T} y,(I-H) y\right)=\left(X^{T} X\right)^{-1} X^{T} \operatorname{cov}(y, y)(I-H) \\ \sigma^{2}\left(X^{T} X\right)^{-1} X^{T}(I-H)=0 \end{array}$

$\text { 这是因为最小二乘法 }(I-H) X=0 \text { 可以推出 } X^{T}(I-H)=0$

$\begin{aligned} &在正态分布假定下，对一元线性回归模型，构造假设检验 H_{0}: 2 \beta_{0}=\beta_{1} \text { v.s. } H_{1}: 2 \beta_{0} \neq \beta_{1} \text { 的检验统计量} \end{aligned}$

在 $G - M$ 假设下，最小二乘估计 $\hat{\boldsymbol{\beta}}$ 与残差向量 $e$ 不相美，即 $Cov(\hat{\boldsymbol{\beta}}, \boldsymbol{e})=\mathbf{0}$ ,进一步，在正态假设下， $\hat{\boldsymbol{\beta}}$ 与e独立，从而 $\hat{\boldsymbol{\beta}}$ 与 $=\mathbf{e}^{\prime} \mathbf{e}=\|\mathbf{e}\|^{2}$ 独立

当 $\sim N\left(\boldsymbol{X} \boldsymbol{\beta}, \sigma^{2} \boldsymbol{I}_{n}\right)$ 时，则
$\hat{\boldsymbol{\beta}} \sim N\left(\boldsymbol{\beta}, \sigma^{2}\left(\boldsymbol{X}^{\prime} \boldsymbol{X}\right)^{-1}\right)$

$\operatorname{SSE} / \sigma^{2} \sim \chi^{2}(n-p-1)$

_OscarLi

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
多元线性回归

多元线性回归y=[y1y2⋮yn],X=[1x11⋯x1p1x21⋯x2p⋮⋮⋮1xn1⋯xnp],ϵ=[ϵ1ϵ2⋮ϵn],β=[β0β1⋮βp]y=\left[\begin{array}{c}y_{1} \\y_{2} \\\vdots \\y_{n}\end{array}\right], X=\left[\begin{array}{cccc}1 & x_{11} & \cdots & x_{1 p} \\1 & x_{21} & \cdots &
复制链接

扫一扫