西瓜书习题11.1 编程实现Relief算法特征选择、正则化总结

最新推荐文章于 2023-11-01 20:39:53 发布

qdbszsj

最新推荐文章于 2023-11-01 20:39:53 发布

阅读量1.7k

点赞数 3

分类专栏： ML

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qdbszsj/article/details/79161080

版权

Relief算法的数据以及代码：https://github.com/qdbszsj/Relief

西瓜书第十一章，主要讲了一下特征选择的方法，通常来说，有很多冗余特征，如果能把这些特征从我们的数据集中筛选出去，那么可以极大地提高我们的程序运行效率，当然有的时候我们还需要人为保留或者创造一些冗余特征，当且仅当这些冗余特征恰好对应了完成任务所需要的“中间概念”。比如要求一个立方体的体积时，输入数据只有长宽高，如果能人为创造一个“底面积”或者“侧面积”这样的冗余特征，那么更容易求解，这个冗余特征要分情况来确定。

这里我们不主要探讨冗余特征，而是多说一些如何筛选特征，也就是搜索一个特征子集，让这个子集训练出来的模型最棒，这个问题显然是NP的，一切搜索方法都有局限性，那么目前我们常用的特征选择方法有三种：过滤式filter、包裹式wrapper、嵌入式embedding。

过滤式选择:

先对数据集进行特征选择，再训练学习器，特征选择与后续学习无关，我这个Relief算法就是一种经典的过滤式选择，Relief是先把每个个体的最近邻求出来，这里有几个分类结果就要求几个对应的近邻，分为猜中近邻（near-hit）和猜错近邻（near-miss），然后根据式11.3求一下各个属性的值就行，分量值越大，对应属性的能力就越强。

包裹式选择：

直接把最终要使用的学习器的性能作为特征子集的评价准则

最低0.47元/天解锁文章

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
西瓜书习题11.1 编程实现Relief算法特征选择、正则化总结

Relief算法的数据以及代码：https://github.com/qdbszsj/Relief西瓜书第十一章，主要讲了一下特征选择的方法，通常来说，有很多冗余特征，如果能把这些特征从我们的数据集中筛选出去，那么可以极大地提高我们的程序运行效率，当然有的时候我们还需要人为保留或者创造一些冗余特征，当且仅当这些冗余特征恰好对应了完成任务所需要的“中间概念”。比如要求一个立方体的体积时，输入数据
复制链接

扫一扫

专栏目录

qdbszsj CSDN认证博客专家 CSDN认证企业博客

码龄9年

237: 原创

13万+: 周排名

191万+: 总排名

39万+: 访问

: 等级

6072: 积分

199: 粉丝

396: 获赞

107: 评论

764: 收藏

私信

关注

热门文章

分类专栏

读后感 17篇
课程 10篇
刷题 80篇
总结与感悟 8篇
工作 6篇
学习笔记 10篇
Leetcode 100篇
ML 11篇

最新评论

西瓜书5.5 编程实现BP神经网络——标准BP算法、累积BP算法
慵懒731: alpha = np.dot(X[i],v) TypeError: can't multiply sequence by non-int of type 'float' 博主好，请问下这里的相乘问题如何解决呢
矩形排样问题遗传算法解决方案
广都--编程每日问: 目前用py实现了遗传算法部分，用c++实现了计算适应度的部分，因为是根据某个具体的算法的伪代码实现的，所以利用率还算不错，最近有时间的话就把他转化为c++版本的。
XGBoost 论文翻译+个人注释
handsomegi: 作者提到不懂为啥taylor二阶展开。我说一下我的见解：在凸优化中最简单的求最小值方法就是最速下降法/梯度下降法和牛顿法。其实GBDT和XGB就是分别对应梯度下降法和牛顿法。（详见我的小红书，我名字叫“拟牛顿法的超线性收敛特征”）
XGBoost 论文翻译+个人注释
一蓉、: 有原文吗，求
西瓜书5.5 编程实现BP神经网络——标准BP算法、累积BP算法
a669466956: 大于0.5是，小于0.5不是 [code=python] pred[pred>=0.5] = 1 pred[pred<0.5] = 0 [/code]

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。