R语言回归诊断

最新推荐文章于 2024-05-03 16:33:51 发布

Mrrunsen

最新推荐文章于 2024-05-03 16:33:51 发布

阅读量1.3k

点赞数

分类专栏： R语言大学作业文章标签： r语言回归机器学习

本文链接：https://blog.csdn.net/Mrrunsen/article/details/121886426

版权

R语言大学作业专栏收录该内容

1394 篇文章 6163 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

本文探讨了R语言中如何进行回归诊断，强调了模型满足统计假设的重要性。通过lm()函数和summary()函数初步分析模型后，进一步利用confint()函数揭示了回归分析中的问题。文中指出，当模型的统计假设未被满足时，可能导致预测结果的偏差。回归诊断技术，如基础包中的plot()函数生成的四幅图形，是评估和改善模型的关键。文章以一个简单的线性回归为例，展示了如何通过图形诊断回归模型的适用性。

摘要由CSDN通过智能技术生成

使用lm()函数来拟合OLS回归模型，通过summary()函数获取模型参数和相关统计量。但是，没有任何输出告诉你模型是否合适，你对模型参数推断的信心依赖于它在多大程度上满足OLS模型统计假设。虽然在代码清单8-4中summary()函数对模型有了整体的描述，但是它没有提供关于模型在多大程度上满足统计假设的任何信息。为什么这很重要？因为数据的无规律性或者错误设定了预测变量与响应变量的关系，都将致使你的模型产生巨大的偏差。一方面，你可能得出某个预测变量与响应变量无关的结论，但事实上它们是相关的；另一方面，情况可能恰好相反。当你的模型应用到真实世界中时，预测效果可能很差，误差显著。现在让我们通过confint()函数的输出来看看8中states多元回归的问题

> states <- as.data.frame(state.x77[,c("Murder", "Population", 
 "Illiteracy", "Income", "Frost")]) 
> fit <- lm(Murder ~ Population + Illiteracy + Income + Frost, data=states) 
> confint(fit) 
 2.5 % 97.5 % 
(Intercept) -6.55e+00 9.021318 
Population 4.14e-05 0.000406 
Illiteracy 2.38e+00 5.903874 
Income -1.31e-03 0.001441 
Frost -1.97e-02 0.020830

结果表明，文盲率改变1%，谋杀率就在95%的置信区间[2.38, 5.90]中变化。另外，因为Frost

的置信区间包含

了解本专栏

超级会员免费看

Mrrunsen

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
R语言回归诊断

使用lm()函数来拟合OLS回归模型，通过summary()函数获取模型参数和相关统计量。但是，没有任何输出告诉你模型是否合适，你对模型参数推断的信心依赖于它在多大程度上满足OLS模型统计假设。虽然在代码清单8-4中summary()函数对模型有了整体的描述，但是它没有提供关于模型在多大程度上满足统计假设的任何信息。为什么这很重要？因为数据的无规律性或者错误设定了预测变量与响应变量的关系，都将致使你的模型产生巨大的偏差。一方面，你可能得出某个预测变量与响应变量无关的结论，但事实上它们是相关的；另
复制链接

扫一扫