本文介绍了如何在R中运行线性回归。本教程介绍了线性回归的假设以及假设是否违背时的处理方法。它还涵盖了拟合模型和计算模型性能指标以检查线性回归模型的性能。线性回归是最流行的统计技术之一。它已经使用了超过3年。它很容易理解线性回归的输出,因此几乎在每个领域都被广泛接受。
理论部分结束。让我们用R实现线性回归
加载所需的包
library(ggplot2)library(car)library(caret)library(corrplot)
确保上面列出的软件包已经安装并加载到R中。如果尚未安装,则需要使用命令install.packages(“ package-name”)进行安装。
线性回归模型的系数和ANOVA表线性回归模型测试估计等于0的零假设。p值小于0.05的自变量表示我们拒绝5%显着性水平的原假设。这意味着该变量的系数不等于0。较大的p值表示变量对于预测目标变量没有意义。
> summary(fit)
Call:lm(formula = mpg ~ ., data = dat3)Residuals: Min 1Q Median 3Q Max -5.4850 -1.3058 0.1856 1.5278 5.2439Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 16.7823 19.6148 0.856 0.401 cyl6 -1.8025 2.6085 -0.691 0.497 cyl8 -3.5873 4.0324 -0.890 0.383 drat 1.4283 2.1997 0.649 0.523 qsec 0.1003 0.7729 0.130 0.898 vs1 0.7068 2.3291 0.303 0.764 am1 3.2396 2.4702 1.311 0.203 gear4 1.3869 3.0466 0.455 0.653 gear5 2.3776 3.4334 0.692 0.496 carb -1.4836 0.6305 -2.353 0.028 *---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Residual standard error: 3.004 on 22 degrees of freedomMultiple R-squared: 0.8237, Adjusted R-squared: 0.7516 F-statistic: 11.42 on 9 and 22 DF, p-value: 1.991e-06
Analysis of Variance TableResponse: mpg Df Sum Sq Mean Sq F value Pr(>F) cyl 2 824.78 412.39 45.7033 1.464e-08 ***drat 1 14.45 14.45 1.6017 0.21890 qsec 1 2.83 2.83 0.3137 0.58108 vs 1 1.02 1.02 0.1132 0.73969 am 1 26.35 26.35 2.9198 0.10157 gear 2 8.15 4.07 0.4513 0.64254 carb 1 49.96 49.96 5.5363 0.02798 * Residuals 22 198.51 9.02 ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
计算模型性能指标
#提取R平方值> summary(fit)$r.squared
[1] 0.8237094
#提取调整后的R平方值> summary(fit)$adj.r.squared
[1] 0.7515905
> AIC(fit)
[1] 171.2156
> BIC(fit)
[1] 187.3387
往期
回顾
◆R数据科学——线性回归一
◆R数据科学——线性回归二
◆R数据科学——线性回归三
◆R数据科学——线性回归四
◆R数据科学——线性回归五
◆R数据科学——线性回归六
查看更多精彩内容>>