【统计学习系列】多元线性回归模型（七）——模型的样本外预测

最新推荐文章于 2022-06-16 18:17:05 发布

Mikey_Sun

最新推荐文章于 2022-06-16 18:17:05 发布

阅读量3.3k

点赞数

分类专栏：统计学习

本文链接：https://blog.csdn.net/qq_43382509/article/details/103360296

版权

本文介绍了如何在多元线性回归模型中进行样本外预测。首先回顾了模型的拟合优度评判，然后详细阐述了样本外点估计的步骤，通过计算预测值的无偏估计量。接着探讨了样本外区间估计，包括期望值、方差的计算，最终给出了置信区间的构建方法。

摘要由CSDN通过智能技术生成

1. 前文回顾

在上一篇文章中，我们讨论了如何对拟合的模型质量进行评判。（详情请见：【统计学习系列】多元线性回归模型（六）——模型拟合质量评判：拟合优度）。

当模型已经被拟合好，并且拟合优度也达到了预期，我们就可以进一步使用这一模型来进行样本外预测啦！在这一篇文章中，我们来看一看如何应用拟合好的模型来进行样本外预测吧~

首先，先给出总体模型的表达式：

$y_0 = \bm{x}_0^T \bm\beta + \epsilon_0$
其中：x₀ 为样本外解释变量的样本值（已给定）；
y₀ 为待预测被解释变量的真值；
β 为模型参数向量；
ϵ₀ ~ N(0, σ²)为模型误差项。

2. 样本外点估计

基于OLS回归，我们已经得到了模型参数 β 的估计量 β^：
$\bm{\hat\beta} = ( \bm{X}^T \bm{X} )^{-1} \bm{X}^T \bm{y}$
因此，在给定一组新的输入变量（样本外变量）x₀ 的情况下，由模型给出的 y₀ 的预测值 y^₀ 有：
$\hat{y}_0 = \bm{x}_0^T \bm{\hat{\beta}}$
容易验证，y^₀ 是 E(y₀) 的无偏估计量：

$E[\hat{y}_0] = E[\bm{x}_0^T \bm{\hat\beta}] = \bm{x}_0^T \cdot E[ \bm{\hat\beta}] = \bm{x}_0^T \bm{\beta} = E[y_0]$

3. 样本外区间估计

若想要得到 y₀ 的区间估计量，我们首先需要知道 y₀ 所满足的分布。从模型的表达式中我们容易看出，y₀ 是误差项 ϵ₀ 的 线性变换（Linear Transmission），因此，在模型假设成立的前提下，y₀ 也应满足正态分布。又因为正态分布由期望和方差两个指标决定，因此我们只需要计算 y₀ 的期望和方差即可得到 y₀ 的分布。

在第二章中，我们已经得到了 y₀ 的期望值，下面就让我们来计算 y₀ 的方差。

$\text{var}(y_0) = \text{var}(\hat{y}_0 + \epsilon_0) = \text{var}(\hat{y}_0) +\text{var}(\epsilon_0)$

而
$\text{var}(\hat{y}_0) = \text{cov} ( \bm{x}_0^T \bm{\hat{\beta}} , \bm{x}_0^T \bm{\hat{\beta}} )$

最低0.47元/天解锁文章

Mikey_Sun

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
【统计学习系列】多元线性回归模型（七）——模型的样本外预测

文章目录1. 引言2. 样本外点估计3. 样本外区间估计写在最后1. 引言2. 样本外点估计3. 样本外区间估计写在最后欢迎感兴趣的小伙伴来跟作者一起挑刺儿~ 包括但不限于语言上的、排版上的和内容上的不足和疏漏~ 一起进步呀！有任何问题，欢迎在本文下方留言，或者将问题发送至勘误邮箱： mikeysun_bugfix@163.com谢谢大家！...
复制链接

扫一扫