regression Feature Selection

最新推荐文章于 2023-05-30 19:32:30 发布

xiewenbo

最新推荐文章于 2023-05-30 19:32:30 发布

阅读量1k

点赞数

分类专栏：机器学习和数据挖掘

机器学习和数据挖掘专栏收录该内容

64 篇文章 2 订阅

订阅专栏

在我们所有的feature中，其实有很多是没有用的，或者很多feature之间的相关性很强，这时就牵涉到feature selection的问题，除了用前面提到过的假设检验的方法，一般还有如下几种可供选择：

Best Subset Selection : 最笨的办法莫过于在对于中的每一个子集我们都尝试着去拟合，然后计算每个子集所对应的残差平方和RSS，选择具有最小RSS所对应的那个子集。如果把用不同的子集理解为使用不同的liner model，从model selection的角度去考虑就是选择使训练误差最小的那个model。明显这钟方法是一种愚公移山式的天真，我们知道子集的数目为，当p比较大时，开销会大的惊人，所以在实际中往往并不可行。

Forward Stepwise and Backward stepwise Selection ：Forward stepwise Selection是一种贪婪式算法，其最开始的时候所用feature集合为空集F，候选集合H为，如果H中存在，使用比只使用F拟合的效果好，那么从H中选择使拟合效果提升最大的那个，并把加入到F中和从H中剔除。然后重复前面的操作直至H中不存在使拟合效果提升的或者H已为空集了。 Backward stepwise Selection正好同Forward stepwise Selection相反，最开始的集合为全集，然后逐一的剔除,每次剔除的时候使得对拟合效果的影响最小。这里谈到的拟合效果可以使用计算残差平方和RSS或model selection中常用的AIC等指标。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
regression Feature Selection

在我们所有的feature中，其实有很多是没有用的，或者很多feature之间的相关性很强，这时就牵涉到feature selection的问题，除了用前面提到过的假设检验的方法，一般还有如下几种可供选择： Best Subset Selection : 最笨的办法莫过于在对于中的每一个子集我们都尝试着去拟合，然后计算每个子集所对应的残差平方和RSS，选择具有最小RSS所对应
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。