R语言回归诊断

本文探讨了R语言中如何进行回归诊断,强调了模型满足统计假设的重要性。通过lm()函数和summary()函数初步分析模型后,进一步利用confint()函数揭示了回归分析中的问题。文中指出,当模型的统计假设未被满足时,可能导致预测结果的偏差。回归诊断技术,如基础包中的plot()函数生成的四幅图形,是评估和改善模型的关键。文章以一个简单的线性回归为例,展示了如何通过图形诊断回归模型的适用性。
摘要由CSDN通过智能技术生成

使用lm()函数来拟合OLS回归模型,通过summary()函数获取模型参数和 相关统计量。但是,没有任何输出告诉你模型是否合适,你对模型参数推断的信心依赖于它在多 大程度上满足OLS模型统计假设。虽然在代码清单8-4中summary()函数对模型有了整体的描述, 但是它没有提供关于模型在多大程度上满足统计假设的任何信息。 为什么这很重要?因为数据的无规律性或者错误设定了预测变量与响应变量的关系,都将致 使你的模型产生巨大的偏差。一方面,你可能得出某个预测变量与响应变量无关的结论,但事实 上它们是相关的;另一方面,情况可能恰好相反。当你的模型应用到真实世界中时,预测效果可 能很差,误差显著。 现在让我们通过confint()函数的输出来看看8中states多元回归的问题

> states <- as.data.frame(state.x77[,c("Murder", "Population", 
 "Illiteracy", "Income", "Frost")]) 
> fit <- lm(Murder ~ Population + Illiteracy + Income + Frost, data=states) 
> confint(fit) 
 2.5 % 97.5 % 
(Intercept) -6.55e+00 9.021318 
Population 4.14e-05 0.000406 
Illiteracy 2.38e+00 5.903874 
Income -1.31e-03 0.001441 
Frost -1.97e-02 0.020830 

结果表明,文盲率改变1%,谋杀率就在95%的置信区间[2.38, 5.90]中变化。另外,因为Frost

的置信区间包含

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mrrunsen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值