VIF 多重共线性膨胀因子

方差膨胀系数(variance inflation factor,VIF)是衡量多元线性回归模型中复 (多重)共线性严重程度的一种度量。它表示回归系数估计量的方差与假设自变量间不线性相关时方差相比的比值。

多重共线性是指自变量之间存在线性相关关系,即一个自变量可以是其他一个或几个自变量的线性组合。若存在多重共线性,计算自变量的偏回归系数时矩阵不可逆。其表现主要有:整个模型的方差分析结果与各个自变量的回归系数的检验结果不一致,专业判断有统计学意义的自变量检验结果却无意义,自变量的系数或符号与实际情况严重不符等。 检验方法主要有:容忍度(Tolerance)和方差膨胀系数(Variance inflation factor,VIF)。其中最常用的是VIF,计算公式为: 在这里插入图片描述
VIF的取值大于1。VIF值越接近于1,多重共线性越轻,反之越重。当多重共线性严重时,应采取适当的方法进行调整 [3] 。容忍度的值界于0至1之间,当容忍度值较小时,表示此自变量与其他自变量之间存在共线性。容忍度这个变量回归系数的估计值不够稳定,则回归系数的计算值也会有很大误差。方差膨胀系数是容忍度的倒数,VIF越大,表示自变量的容忍度越小,越有共线性问题。

通常以10作为判断边界。当VIF<10,不存在多重共线性;当10<=VIF<100,存在较强的多重共线性;当VIF>=100, 存在严重多重共线性。

例子

from sklearn.datasets import load_iris
from sklearn.preprocessing import MinMaxScaler
from statsmodels.stats.outliers_influence import variance_inflation_factor
import numpy as np
import pandas as pd
min_max_scaler = MinMaxScaler()
iris = load_iris()
iris_scaler = min_max_scaler.fit_transform(iris.data)
iris_scaler = pd.DataFrame(iris_scaler)
iris_scaler['target'] = iris.target
X = np.matrix(iris_scaler)
VIF_list = [variance_inflation_factor(X, i) for i in range(X.shape[1])]
print(VIF_list)

返回值为

[28.06795814087517,
 3.80566826039568,
 85.84941787221807,
 60.42475320136888,
 35.615649563661286]
  • 9
    点赞
  • 46
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
VIF(Variance Inflation Factor,方差膨胀因子)是一种用于检测多重共线性的统计量。根据引用\[1\]和引用\[2\]的内容,VIF的取值大于1,VIF值越接近于1,多重共线性越轻,反之越重。通常以10作为判断边界。当VIF<10,不存在多重共线性;当10<=VIF<100,存在较强的多重共线性;当VIF>=100,存在严重多重共线性。 在进行线性回归分析时,可以使用VIF来检测多重共线性。一般来说,如果VIF大于2,就表明存在多重共线性问题。因此,可以通过计算每个变量的VIF值来判断是否存在多重共线性。如果某个变量的VIF值较高,说明该变量与其他自变量之间存在较强的线性关系,可能会影响回归模型的准确性。 综上所述,VIF是一种用于检测多重共线性的统计量,通过计算每个变量的VIF值可以判断是否存在多重共线性问题。当VIF大于2时,表明存在多重共线性。 #### 引用[.reference_title] - *1* *3* [数据分析——多重共线性检验](https://blog.csdn.net/qq_36336522/article/details/105897548)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [R 检测多重共线性](https://blog.csdn.net/Mrrunsen/article/details/121886670)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值