多元线性模型分类变量方差_第三十一讲 R多元线性回归中的多重共线性和方差膨胀因子...

在前两讲中,我们介绍了多元线性回归的概念以及多元线性回归中的交互作用。今天学习的主要内容是多元线性回归中的多重共线性和方差膨胀因子。

1. 共线性的概念

1

共线性

在多元回归中,两个或多个预测变量可能彼此相关,这种情况称为共线性(multicollinearity)。

2

多重共线性

存在一种称为多重共线性的极端情况,其中三个或更多变量之间存在共线性,即使没有一对变量具有特别高的相关性。这意味着预测变量之间存在冗余。

重点:在存在多重共线性的情况下,回归模型的解变得不稳定 2. 共线性的评估

对于给定的预测变量(p),可以通过计算一个称为方差膨胀因子(variance inflation factor,VIF)的分数来评估多重共线性,该分数测量由于模型中的多重共线性而使回归系数的方差膨胀了多少。

VIF的最小可能值为1(不存在多重共线性)。根据经验,VIF值超过5或10表示有共线性问题。

面对多重共线性时,应删除相关的变量,因为多重共线性的存在意味着在存在其他变量的情况下该变量提供的有关响应的信息是多余的 。

3. 多重共线性检验的R实现

3.1 加载所需的R包

  • tidyverse 便于数据操作和可视化
  • caret 简化机器学习工作流程
library(tidyverse)library(caret)
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值