python检验多重共线性_利用Python进行VIF检验

本文介绍了统计学中的多重共线性问题,指出它如何影响多元线性回归模型的参数估计,特别是在Python中进行VIF检验的重要性。VIF值高于5通常表明存在严重多重共线性,而相关系数高并不一定意味着共线性。文章提供了一个简单的Python代码示例来计算VIF,强调在计算时必须包含常数项。
摘要由CSDN通过智能技术生成

在统计学中,多重共线性(共线性)是指多元线性回归模型中的某个预测变量(自变量/解释变量)可以以相当大的准确度通过其他预测变量线性预估。 在这种情况下,模型或数据的微小变化就可能导致多元回归模型的系数估计值出现不规律地改变,可能造成如下后果:回归系数的普通最小二乘估计量可靠度降低。如图1与2所示,随着多重共线性程度的提高,参数方差(

表示变量

的相关度)会急剧上升到很大的水平,理论上使最小二乘法估计的有效性、可靠性和价值都受到影响,实践中参数估计的可靠程度下降。图1. 二元线性回归模型图2. 二元线性回归系数的最小二乘估计量与方差回归系数的普通最小二乘估计量的业务含义不合理。如β1的普通最小二乘估计量的意义是:在自变量

维持不变的情况下,自变量

每变化一个单位时因变量

的均值的变化率。然而,模型在存在不完全多重共线性的问题时,自变量

是高度线性相关的,因此无法做到保持变量

不变的情况下,只

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值