线性回归模型可 用于两件事:
(1)量化一个或多个预测变量与响应变量之间的关系。
(2) 使用模型预测未来值。
关于 (2),当我们使用回归模型来预测未来值时,我们通常对预测 精确值 以及 包含一系列可能值的区间 感兴趣。这个区间称为 预测区间。
例如,假设我们使用 学习时间 作为预测变量, 考试成绩 作为响应变量来拟合一个简单的线性回归模型。使用这个模型,我们可以预测一个学习 6 小时的学生将获得91的考试成绩。
但是,由于此预测存在不确定性,我们可能会创建一个预测区间,表示学习 6 小时的学生有 95% 的机会获得85到97之间的考试成绩。这个值范围被称为 95% 的预测区间,它对我们来说通常比仅仅知道准确的预测值更有用。
如何在 R 中创建预测区间
为了说明如何在 R 中创建预测区间,我们将使用内置的 mtcars 数据集,其中包含有关几种不同汽车特征的信息:
首先,我们将拟合一个简单的线性回归模型,使用 disp 作为预测变量, mpg 作为响应变量。
#fit