python 残差图_为啥一定要用残差图检查你的回归分析?

残差图是回归分析的重要检查工具,用于验证模型的随机性和不可预测性。有效的模型中,残差应是随机且不可预测的。如果残差呈现出特定模式,可能意味着模型中遗漏了变量、高阶项或交互项。通过残差图,我们可以发现并修正模型的不足,确保模型可信。
摘要由CSDN通过智能技术生成

先说残差图究竟是什么鬼。

c9022affd8b9

Residual Illustration

残差图是指以残差为纵坐标,以任何其他指定的量为横坐标的散点图。(上图仅是残差的示意图,非残差图,残差图可见下文)

用普通最小二乘法(OLS)做回归分析的人都知道,回归分析后的结果一定要用残差图(residual plots)来检查,以验证你的模型。你有没有想过这究竟是为什么?残差图又究竟是怎么看的呢?

这背后当然有数学上的原因,但是这里将着重于聊聊概念上的理解。从根本上说,随机性(randomness)和不可预测性(unpredictability)是任何回归模型的关键组成部分,如果你没有考虑到这两点,那么你的模型就不可信了,甚至说是无效的。

为什么这么说呢?首先,对于一个有效的回归模型来说,可以细分定义出两个基本组成部分:

Response =(Constant + Predictors)+ Error

我想说的是另一种说法,那就是:

响应(Response) = 确定性(Deterministic) + 随机性(Stochastic)

(有时候真是不得不吐槽下,毕竟是外国人发明的现代科学,中文翻译过来难眠有混淆视听之嫌,学术词汇的理解还是看英文更能清晰本质,一会就会聊到Stochastic就明白为什么这么说)

确定性部分(The Deterministic Portion)

为了完整,先提一下Deterministic这部分。在预测模型中

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python中,我们可以使用matplotlib库来绘制散点分析。首先,我们需要进行线性回归分析,然后使用检查模型的拟合情况。具体步骤如下: 1. 导入所需的库和数据集。 2. 使用sklearn库中的线性回归模型进行拟合。 3. 使用matplotlib库绘制,横坐标为预测值,纵坐标为值。 4. 检查中是否存在任何模式或趋势,如果存在,则说明模型可能存在问题。 下面是一个简单的Python代码示例,用于绘制散点分析: ``` import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression # 导入数据集 X = [[1], [2], [3], [4], [5]] y = [2, 4, 5, 4, 5] # 创建线性回归模型 model = LinearRegression() model.fit(X, y) # 绘制 y_pred = model.predict(X) residuals = y - y_pred plt.scatter(y_pred, residuals) plt.xlabel('Predicted Values') plt.ylabel('Residuals') plt.axhline(y=0, color='r', linestyle='-') plt.show() ``` 在这个例子中,我们使用了一个简单的数据集,包含5个样本。我们使用sklearn库中的LinearRegression模型进行拟合,并使用matplotlib库绘制。在中,横坐标为预测值,纵坐标为值。我们还添加了一条红色的水平线,表示为0的位置。 如果中存在任何模式或趋势,例如值随预测值的增加而增加或减少,那么就需要重新检查模型的拟合情况,并可能需要进行调整。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值