vif()干啥用的
计算 方差膨胀(variance-inflation) 和 广义线性方差膨胀因子(generalized variance-inflation factors for linear)。方差膨胀因子越小,多重共线性程度越小,自变量之间越没关系。具体解释见文末,看不看都行。
咋用
vif(model, merge_coef = FALSE)
参数啥意思
model: 填你用某个模型计算的计算结果那个变量
merge_coef:
merge_coef = FALSE
默认值为FALSE, 不与模型汇总矩阵的系数合并。
merge_coef = TRUE
与模型汇总矩阵的系数合并。
怎么用
越大越
比如:在多元回归中,用这个。
下次回归删除膨胀系数(vif结果)大于5的最大值。直到没有大于5的值。
跑个例子看看(自带的数据)
data(germancredit)
读取这个dataframe
fit1 = glm(creditability~ age.in.years + credit.amount +
present.residence.since, family = binomial(), data = germancredit)
做个多元回归
vif(fit1)
看看膨胀系数(此时merge_coef = FALSE,)
vif(fit1,merge_coef = TRUE)
看看膨胀系数
这段看不看都行:
(方差膨胀因子用于 确定多重共线性程度(multicollinearity),多重共线性会在多元回归中产生问题,因为自变量间相互不独立,难以在回归模型中测试自变量的组合对因变量的影响程度。存在高度多重共线性的多元回归模型会使估计每个自变量与因变量之间的关系变得更加困难。所用数据或模型方程结构的微小变化都会导致自变量的估计系数发生巨大且不稳定的变化。为确保正确指定模型并正确运行,可以运行多重共线性测试。方差膨胀因子就是这样一种测量工具。使用方差膨胀因子有助于确定任何多重共线性问题的严重性,以便可以调整模型。方差膨胀因子衡量自变量的行为(方差)受其与其他自变量的相互作用/相关性影响或膨胀的程度。方差膨胀因子允许快速测量变量对回归中标准误差的贡献程度。当存在显着的多重共线性问题时,所涉及的变量的方差膨胀因子将非常大。确定这些变量后,可以使用多种方法来消除或组合共线变量,从而解决多重共线性问题。)