R数据分析：逐步回归的做法和原理，案例剖析

公众号Codewar原创作者

于 2021-02-16 17:58:56 发布

阅读量6.3k

点赞数 10

分类专栏： R 文章标签：数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tm_ggplot2/article/details/113826793

版权

做回归的时候经常头痛的一个问题就是变量的选择，好多人一放一大堆变量但是结果做出来都没意义，这个时候你可以试试让算法给你选择最优的自变量组合哟。

那么今天要写的就是回归时筛选变量的逐步法：

The stepwise regression (or stepwise selection) consists of iteratively adding and removing predictors, in the predictive model, in order to find the subset of variables in the data set resulting in the best performing model, that is a model that lowers prediction error.

逐步法又分三种策略：

前进：就是把变量按照贡献大小一个一个的往回归模型中放，直到所有自变量都是显著的为止。
后退：就是把所有的自变量都放进去然后把贡献小的自变量一个一个的往出来取，直到所有的自变量都显著。
逐步Stepwise selection：这个就是把两种方法结合起来，先是把贡献大的变量一个一个放（前进），所有变量放完了又把没有贡献的取出来（后退）。

R语言实操

在R中能做逐步回归的方法有很多，比如：

stepAIC() [MASS 包]
regsubsets() [leaps 包]
train() [caret 包]

今天我还是给大家写一个例子，这个例子我们用train来做，train()有一个可选参数 method，这个参数可以有

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

公众号Codewar原创作者 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。