特征选择和特征提取，及其分类

最新推荐文章于 2024-06-27 10:37:12 发布

xinhuaxi120

最新推荐文章于 2024-06-27 10:37:12 发布

阅读量7.8k

点赞数 1

分类专栏： feature selection 文章标签： feature selection

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xinhuaxi120/article/details/87778348

版权

feature selection 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

特征选择：从大规模的特征空间中提取与所需任务相关的特征。

特征提取：结合任务本身的特点，通过结合和转换原始的特征集，构造出新的特征。

基于特征的选择的机制，特征选择可以分为四类：

1）Filter 方法

特点： 1. 不借助学习算法； 2. 依赖于真实世界的数据集的特征； 3. 一般方式是为每一个特征进行“打分”评估；即给每一维权重赋予权重，权重即代表了该特征的重要性，然后按重要性进行排序。

代表：Chi-squared test （卡方检验）、 information gain （信息增益）、 correlation coefficient scores（相关系数）

2）wrapper 方法

特点：1. 借助学习算法，通过选择出特征评价分类的准确性，来评判特征选择的好坏。 2.计算的复杂度高 3. 一般看成选择最优的特征组合，借助一些常用的优化算法可以解决。

代表： recursive feature elimination algorithm （递归特征消除算法），具体的使用方法可以参考：sklearn 中的 wrapper 方法特征选择

3） embedded 方法

特点：1. 依赖于学习算法选择，不同学习算法使用不同的特征组合

代表：正则化（L1 norm ， L2 norm ， L2-P norm）， Ridge Regression （岭回归）线性回归

4） hybrid 方法

特点： 1. filter 和 wrapper 方法结合物

代表：

参考文献：

Hoque N, Ahmed H A, Bhattacharyya D K, et al. A fuzzy mutual information-based feature selection method for classification[J]. Fuzzy Information and Engineering, 2016, 8(3): 355-384.

https://blog.csdn.net/google19890102/article/details/40019271

关注

1
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。