【ML】特征提取3种基本方法

最新推荐文章于 2023-05-03 15:00:17 发布

YWP_2016

最新推荐文章于 2023-05-03 15:00:17 发布

阅读量1.7k

点赞数 3

分类专栏： ML

原文链接：https://www.jianshu.com/p/7f3502cf9cae

版权

ML 专栏收录该内容

13 篇文章 4 订阅

订阅专栏

作者：hellpppp
链接：https://www.jianshu.com/p/7f3502cf9cae
来源：简书

注意：评论中有人指出，这是特征选择方法，我也布吉岛鸭

附：特征提取VS特征选择 https://wenku.baidu.com/view/517e175d905f804d2b160b4e767f5acfa0c78363.html

嵌入（embed）：学习算法中本来就包含有特征选择的过程，例如决策树一类的分类器，它们在决定分枝点时就会选择最有效的特征来对数据进行划分。但这种方法是在局部空间中进行优选，效果相对有限。

封装(Wrapper)：特征选择过程与训练过程整合在一起，以模型的预测能力作为衡量特征子集的选择标准，例如分类精度，有时也可加入复杂度惩罚因子。多元线性回归中的前向搜索和后向搜索可以说是封装方法的一种简单实现。不同的学习算法要搭配不同的封装方法，如果是线性分类器，可以采用之前博文谈到的LASSO方法（glmnet包）。如果是非线性分类器，如树模型则可以采用随机森林封装（RRF包）。封装法可以选择出高质量的子集，但速度会比较慢。

过滤(Filter)：特征选择过程独立于训练过程，以分析特征子集内部特点来预先筛选，与学习器的选择无关。过滤器的评价函数通常包括了相关性、距离、信息增益等。在数据预处理过程中删除那些取值为常数的特征就是过滤方法的一种。过滤法速度快但有可能删除有用的特征。

在实务中进行特征选择可以先借由专家知识来初步筛选，再用过滤法快速筛选无关变量，最后采用封装法得到最优子集和模型结果。

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【ML】特征提取3种基本方法

作者：hellpppp链接：https://www.jianshu.com/p/7f3502cf9cae来源：简书注意：评论中有人指出，这是特征选择方法，我也布吉岛鸭附：特征提取VS特征选择https://wenku.baidu.com/view/517e175d905f804d2b160b4e767f5acfa0c78363.html嵌入（embed）：学习算法中本来就包含有...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。