统计|如何理解线性回归分析中残差检验的基本步骤

本博文源于《商务统计》,旨在讲述如何对线性回归分析中已经拟合好的直线做残差分析。当谈起残差,必须了解残差是y的实际值和预测值之差。

线性回归模型的残差检验假定条件

  • 线性假定:X与Y之间的关系是线性的
  • 独立性假定:对于一个特定的x,它所对应的残差 ∈ \in 与其它x所对应的残差 ∈ \in 相互独立
  • 正态假定:残差服从期望为0的一个正态分布
  • 同方差假定:对于所有的x,残差 ∈ \in 的方差都是相同的

残差检验的基本步骤

线性关系的检验

横轴自变量,纵轴因变量
横轴自变量,纵轴残差

在这里插入图片描述
从图上可以看见这是非线性关系,说明不满足残差检验的假定条件

在这里插入图片描述
从图上可以看见都落于水平线周围,比较均匀,这符合残差检验的假定条件线性假定。

独立性假定检验

跟上面一样画个残差图,如果图上显示的非水平,带有曲线的味道,那就非独立。一般统计软件已经帮你做好了,只需要看下非独立的情况长什么样就行了。
在这里插入图片描述

正态性假定检验

这个统计软件也可以,那就是QQ图,matlab可以做
matlabqq(Quantile-Quantile)图绘制并讲解
在这里插入图片描述
服从正态分布的QQ图,就跟图上类似,点在一条直线上。

同方差假定检验

也是画散点图,如果不是水平线上,那就是异方差。
在这里插入图片描述

总结

在做线性回归分析残差检验中,牢记画两个图就行了,一种是残差图,一种是QQ图。目的就是测量是否满足四种线性回归模型的假定。

  • 12
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
在Scikit-learn线性回归模型并不直接提供残差分析的功能,但我们可以通过一些方法来进行线性回归模型的残差分析。以下是使用Scikit-learn进行线性回归残差分析的一般步骤: 1. 导入必要的库和模块: ```pythonimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.linear_model import LinearRegression``` 2. 准备数据: 假设我们有自变量X和因变量y,可以使用Numpy库生成随机数据进行演示: ```python#生成随机数据np.random.seed(0) X = np.random.rand(100,1) y =2 +3 * X + np.random.randn(100,1) ``` 3. 拟合线性回归模型: ```python# 创建线性回归模型对象model = LinearRegression() # 拟合模型model.fit(X, y) ``` 4. 计算残差: ```python# 预测值y_pred = model.predict(X) # 计算残差residuals = y - y_pred``` 5. 进行残差分析: ```python# 绘制残差图plt.scatter(y_pred, residuals) plt.xlabel('Predicted values') plt.ylabel('Residuals') plt.axhline(0, color='red', linestyle='--') plt.title('Residual Plot') plt.show() ``` 在残差,我们希望看到残差分布在0附近,且没有明显的模式或趋势。 此外,你还可以使用其他方法来进行进一步的残差分析,如绘制残差的直方图、Q-Q图来检查残差的正态性,或者进行统计检验来评估残差的同方差性和独立性。 请注意,Scikit-learn是一个机器学习库,主要用于建模和预测任务。如果需要更详细的统计分析和残差诊断,建议使用专门的统计分析库,如statsmodels。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值