西瓜书+实战+吴恩达机器学习（十九）特征选择（过滤式选择、包裹式选择）

最新推荐文章于 2024-02-25 23:45:20 发布

I can丶

最新推荐文章于 2024-02-25 23:45:20 发布

阅读量1.7k

点赞数 4

分类专栏：机器学习文章标签：机器学习特征选择过滤式包裹式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhq9695/article/details/87860108

版权

本文介绍了特征选择在机器学习中的重要性，包括缓解维度灾难、降低学习任务难度。内容涵盖过滤式选择和包裹式选择两种方法。过滤式方法如Relief算法，通过相关统计量评估特征；包裹式选择则直接以学习器性能为评价标准，如LVW方法，但计算成本较高。

摘要由CSDN通过智能技术生成

文章目录

0. 前言
1. 过滤式选择
2. 包裹式选择

如果这篇文章对你有一点小小的帮助，请给个关注，点个赞喔，我会非常开心的~

0. 前言

特征选择是一个很重要的数据预处理过程：

选择出重要的特征可以缓解灾难维数问题
去除不相关特征可以降低学习任务的难度

特征选择可分为子集搜索和子集评价：

子集搜索：前向搜索（逐渐增加特征），后向搜索（逐渐减少特征）
子集评价：可采用信息增益对子集进行评价

1. 过滤式选择

过滤式方法先对数据进行特征选择，然后再训练分类器。

Relief（Relevant Features）是著名的过滤式特征选择方法。该方法假设特征子集的重要性是由子集中的每个特征所对应的相关统计量分量之和所决定的。所以只需要选择前 $k$ 个大的相关统计量对应的特征，或者大于某个阈值的相关统计量对应的特征即可。

Relief先在 $x_i$ 的同类样本中寻找其最近邻 $x_{i,nh}$ 称为“猜中近邻”，再从 $x_i$ 个异类样本中寻找其最近邻 $x_{i,nm}$ 称为“猜错近邻”，属性 $j$ 的相关统计量定义为：

最低0.47元/天解锁文章

关注

4
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。