如果有什么问题和项目作业关于R语言,可以微信call我:RunsenLiu
我们经常使用三个不同的平方和值来衡量回归线与数据集的实际拟合程度:
- 总平方和 (SST) – 单个数据点 (y i ) 与响应变量 ( y ) 的平均值之间的平方差之和。
SST = Σ(y i – y ) 2
2. 平方和回归 (SSR) – 预测数据点 (ŷ i ) 与响应变量 ( y ) 的平均值之间的平方差之和。
SSR = Σ(ŷ i – y ) 2
3. 误差平方和 (SSE) – 预测数据点 (ŷ i ) 和观测数据点 (y i )之间的平方差之和。
SSE = Σ(ŷ i – y i ) 2
以下分步示例显示了如何为 R 中的给定回归模型计算这些指标中的每一个。
第 1 步:创建数据
首先,让我们创建一个数据集,其中包含某所大学 20 名不同学生的学习小时数和考试成绩:
#create data frame
df <- data.frame(hour