特征选择

最新推荐文章于 2024-01-23 21:18:37 发布

菜鸡的自我拯救

最新推荐文章于 2024-01-23 21:18:37 发布

阅读量875

点赞数

分类专栏：机器学习/深度学习算法机器学习/深度学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_37659245/article/details/97616127

版权

从给定的特征集合中选择出相关特征子集的过程，称为特征选择。它是”数据预处理“中重要的一步。scikit-learn 机器学习库提供了两种不同的特征选择方法：RFE和决策树。

1、为什么要进行特征选择？

1）解决维度灾难的问题，降低运算量，使模型泛化能力更强，减少过拟合

缩短模型训练时间。减少数据，意味着算法训练更快。减少冗余数据，意味着根据噪声做出决策的机会更少。

特征选择与降维处理是处理高维数据的两大技术。

2）去除不相关特征可以降低学习难度。增强对特征和特征值之间的理解。

3）提高准确度

减少误导性数据，意味着将会提高模型准确度。

2、无关特征与冗余特征

1）无关特征：与当前学习任务无关

2）冗余特征：它们所包含的信息能从其他特征中推演出。

如：特征中已经有长和宽两个特征了，那么面积就是一个冗余特征。冗余特征大多数情况下不起作用，但是有时可以降低学习的难度。见《西瓜书》P247

3、特征选择的方法：

1）常见的特征选择方式（操作层面上）：

最低0.47元/天解锁文章

菜鸡的自我拯救

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
特征选择

从给定的特征集合中选择出相关特征子集的过程，称为特征选择。它是”数据预处理“中重要的一步。scikit-learn 机器学习库提供了两种不同的特征选择方法：RFE和决策树。1、为什么要进行特征选择？1）解决维度灾难的问题，降低运算量，使模型泛化能力更强，减少过拟合缩短模型训练时间。减少数据，意味着算法训练更快。减少冗余数据，意味着根据噪声做出决策的机会更少。特征选择与降维处理是处理高维数...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。