使用lm()函数来拟合OLS回归模型,通过summary()函数获取模型参数和 相关统计量。但是,没有任何输出告诉你模型是否合适,你对模型参数推断的信心依赖于它在多 大程度上满足OLS模型统计假设。虽然在代码清单8-4中summary()函数对模型有了整体的描述, 但是它没有提供关于模型在多大程度上满足统计假设的任何信息。 为什么这很重要?因为数据的无规律性或者错误设定了预测变量与响应变量的关系,都将致 使你的模型产生巨大的偏差。一方面,你可能得出某个预测变量与响应变量无关的结论,但事实 上它们是相关的;另一方面,情况可能恰好相反。当你的模型应用到真实世界中时,预测效果可 能很差,误差显著。 现在让我们通过confint()函数的输出来看看8中states多元回归的问题
> states <- as.data.frame(state.x77[,c("Murder", "Population",
"Illiteracy", "Income", "Frost")])
> fit <- lm(Murder ~ Population + Illiteracy + Income + Frost, data=states)
> confint(fit)
2.5 % 97.5 %
(Intercept) -6.55e+00 9.021318
Population 4.14e-05 0.000406
Illiteracy 2.38e+00 5.903874
Income -1.31e-03 0.001441
Frost -1.97e-02 0.020830
结果表明,文盲率改变1%,谋杀率就在95%的置信区间[2.38, 5.90]中变化。另外,因为Frost
的置信区间包含