验证回归模型的残差是否符合正态分布(R语言)
残差是指回归模型预测值与实际观测值之间的差异。在回归分析中,我们通常假设残差服从正态分布。验证残差是否符合正态分布对于评估回归模型的合适性以及进行进一步统计推断非常重要。本文将介绍如何使用R语言来验证回归模型的残差是否符合正态分布。
首先,我们需要拟合一个线性回归模型并获取残差。假设我们有一个自变量X和一个因变量Y,我们可以使用R中的lm()函数来拟合线性回归模型并获取残差。下面是一个示例:
# 创建示例数据
set.seed(123)
X <- rnorm(100)
Y <- 2*X + rnorm(100)
# 拟合线性回归模型
model <- lm(Y ~ X)
# 获取残差
residuals <- residuals(model)
在上面的代码中,我们首先创建了一个示例数据集,其中X是一个服从标准正态分布的随机变量,Y是根据线性关系生成的响应变量,并添加了一些误差。然后,我们使用lm()函数拟合了一个线性回归模型,并通过residuals()函数获取了残差。
接下来,我们可以使用一些统计测试来验证残差是否符合正态分布。以下是两种常用的方法:
- 直方图和正态概率图检验:
直方图和正态概率图是常用的可视化工具,用于初步检查数据是否符合正态分布。我们可以使用R中的