![d6b9f66a65a53fa5174f430dda38614e.png](https://img-blog.csdnimg.cn/img_convert/d6b9f66a65a53fa5174f430dda38614e.png)
线性回归的一个主要目标是基于一个或多个预测变量来预测结果值。(我们也用它来研究两个变量的相关性,同时校正其他混杂因素)。那么,当我们取得了预测模型后,根据该预测模型对新数据进行预测得出的预测值是什么?这个预测值的可信度如何呢?今天的讲解中,我们会给出答案。
1. 建立线性回归
我们首先建立一个简单的线性回归模型,该模型根据速度预测汽车的停车距离。
# 加载数据
data("cars", package = "datasets")
# 建立模型
model <- lm(dist ~ speed, data = cars)
model
##
## Call:
## lm(formula = dist ~ speed, data = cars)
##
## Coefficients:
## (Intercept) speed
## -17.58 3.93
线性模型方程可写为:dist = -17.579 + 3.932*speed。
请注意,变量speed和dist的单位分别是mph和ft。
2. 对新数据集的预测
使用以上模型,我们可以预测新速度值的停车距离。
首先创建一个新的数据框&#x