什么是多重共线性？

最新推荐文章于 2024-11-04 09:22:32 发布

CM莫问

最新推荐文章于 2024-11-04 09:22:32 发布

阅读量1.2k

点赞数 4

分类专栏：人工智能算法常见概念文章标签：算法人工智能机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ChaneMo/article/details/142439293

版权

一、多重共线性概念

多重共线性（Multicollinearity）是统计学和数据分析中的一个概念，它指的是在多元回归模型中，两个或多个解释变量（特征）之间存在较高的线性相关性。当多重共线性发生时，它会影响模型的稳定性和解释能力，使得模型参数的估计变得不稳定和不准确。

二、多重共线性的成因

1、数据内在特性：某些领域内的数据自然就会存在高度相关性，例如，一个地区的房价与地税往往存在正相关。

2、数据收集方式：如果数据是通过同一测量过程或相似的测量工具收集的，那么这些变量可能会表现出共线性。

3、变量构造：在特征工程过程中，可能会因为人为因素而不小心创建出高度相关的特征。

三、多重共线性的表现

1、参数估计的不稳定：高度相关的特征会导致回归系数的估计变得不稳定，即使是微小的数据变化也可能导致估计值的大幅波动。

2、统计显著性降低：多重共线性可能导致回归系数的统计显著性降低，使得原本重要的特征看起来不再显著。

3、模型预测能力下降：由于参数估计的不稳定，多重共线性可能导致模型的预测能力下降。

4、方差膨胀因子（VIF）增加：方差膨胀因子是衡量多重共线性严重程度的一个指标，VIF值大于10通常被认为是存在严重的多重共线性。

四、多重共线性的检测

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。