【067】特征工程之 Wrapper 法

最新推荐文章于 2025-03-26 11:20:00 发布

小麦粒

最新推荐文章于 2025-03-26 11:20:00 发布

阅读量3.8k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010986753/article/details/105828849

版权

本文介绍了特征工程中的Wrapper方法，包括稳定性选择、递归特征消除、特征值排序选择等，详细阐述了它们的工作原理、优缺点，并对比了Wrapper方法与嵌入法的区别。文章强调了特征选择的重要性，特别是稳定性选择在克服过拟合和数据理解方面的优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、Wrapper 包装法

封装器用选取的特征子集对样本(标签)集进行训练学习，训练的精度(准确率)作为衡量特征子集好坏的标准,经过比较选出最好的特征子集。常用的有逐步回归（Stepwise regression）、向前选择（Forward selection）和向后选择（Backward selection）。
工作原理
包装法是指使用算法模型对特征子集与目标(标签)集进行训练评估，根据训练的精度(准确率)衡量特征子集的好坏，从而挑选出最好的特征子集。
优缺点
优点：考虑了特征之间组合以及特征与标签之间的关联性。
缺点：由于要划分特征为特征子集并且逐个训练评分，因此当特征数量较多时,计算时间又会增长；另外在样本数据较少的时候，容易过拟合。当观测数据较少时容易过拟合，而当特征数量较多时,计算时间又会增长。

2、稳定性选择(Stability Selection)

工作原理
稳定性选择是一种基于二次抽样和选择算法(训练模型)相结合的方法，选择算法可以是回归、分类SVM或者类似算法。
原理实现：在不同的特征子集上运行训练模型，不断地重复，最终汇总特征选择的结果。比如可以统计某个特征被认为是重要特征的频率
（被选为重要特征的次数除以它所在的子集被测试的次数）。理想情况下，重要特征的得分会接近100%。稍微弱一点的特征得分

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。