R语言检验多重共线性 vif

最新推荐文章于 2024-07-25 10:11:38 发布

蘑菇仙人

最新推荐文章于 2024-07-25 10:11:38 发布

阅读量4.9k

点赞数 4

文章标签： r语言算法

原文链接：https://zhuanlan.zhihu.com/p/434151670

版权

vif()干啥用的

计算方差膨胀（variance-inflation）和广义线性方差膨胀因子（generalized variance-inflation factors for linear）。方差膨胀因子越小，多重共线性程度越小，自变量之间越没关系。具体解释见文末，看不看都行。

咋用

vif(model, merge_coef = FALSE)

参数啥意思

model: 填你用某个模型计算的计算结果那个变量

merge_coef:

merge_coef = FALSE

默认值为FALSE, 不与模型汇总矩阵的系数合并。

merge_coef = TRUE

与模型汇总矩阵的系数合并。

怎么用

越大越

比如：在多元回归中，用这个。

下次回归删除膨胀系数（vif结果）大于5的最大值。直到没有大于5的值。

跑个例子看看（自带的数据）

data(germancredit)

读取这个dataframe

fit1 = glm(creditability~ age.in.years + credit.amount +

present.residence.since, family = binomial(), data = germancredit)

做个多元回归

vif(fit1)

看看膨胀系数（此时merge_coef = FALSE,）

vif(fit1,merge_coef = TRUE)

看看膨胀系数

这段看不看都行：

（方差膨胀因子用于确定多重共线性程度（multicollinearity），多重共线性会在多元回归中产生问题，因为自变量间相互不独立，难以在回归模型中测试自变量的组合对因变量的影响程度。存在高度多重共线性的多元回归模型会使估计每个自变量与因变量之间的关系变得更加困难。所用数据或模型方程结构的微小变化都会导致自变量的估计系数发生巨大且不稳定的变化。为确保正确指定模型并正确运行，可以运行多重共线性测试。方差膨胀因子就是这样一种测量工具。使用方差膨胀因子有助于确定任何多重共线性问题的严重性，以便可以调整模型。方差膨胀因子衡量自变量的行为（方差）受其与其他自变量的相互作用/相关性影响或膨胀的程度。方差膨胀因子允许快速测量变量对回归中标准误差的贡献程度。当存在显着的多重共线性问题时，所涉及的变量的方差膨胀因子将非常大。确定这些变量后，可以使用多种方法来消除或组合共线变量，从而解决多重共线性问题。）

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。