[机器学习笔记] 特征（Feature）和特征选择(Feature Selection)

最新推荐文章于 2024-07-24 15:34:23 发布

梅森上校

最新推荐文章于 2024-07-24 15:34:23 发布

阅读量3k

点赞数 1

分类专栏：机器学习（ML）

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/seagal890/article/details/105084892

版权

特征选择是机器学习中的重要预处理步骤，旨在减少不相关或冗余特征，提高模型精度和泛化能力。通过过滤法、包装法和嵌入法等策略，如前向选择和后向消除，选择出对模型最有影响力的特征子集。特征选择有助于避免维度灾难，减少训练时间并增强对数据的理解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

特征（Feature）和特征选择(Feature Selection)

概念解释

在机器学习中，将属性称为“特征（Feature）”，对当前学习任务有用的属性称为“相关特征（Relevant Feature）”，没有什么用的属性称为“无关特征（Irrelevant Feature）”。从给定的特征集合中选择出相关特征子集的过程，称为“特征选择（Feature Selection）”

特征选择是一个重要的数据预处理过程。在现在的机器学习中，获得数据之后通常先进行特征选择，此后再训练学习器。

特征选择过程必须确保不丢失重要特征，否则后续学习过程会因为重要信息的缺失而无法获得好的性能。给定数据集，若学习任务不同，则相关特征很可能不同。

另外，有一类特征称为“冗余特征（Redundant Feature）”，它们所包含的信息能从其它特征中推演出来。那么，去除冗余特征会减轻学习过程的负担。

特征选择的目的

在机器学习的实际应用中，特征数量往往较多，其中可能存在不相关的特征，特征之间也可能存在相互依赖，容易导致如下的后果：

特征个数越多，分析特征、训练模型所需的时间就越长。
特征个数越多，容易引起“维度灾难”，模型也会越复杂，其推广能力会下降。

特征选择能剔除不相关(irrelevant)或亢余(redundant )的特征，从而达到减少特征个数，提高模型精确度，减少运行时间的目的。另一方面，选取出真正相关的特征简化了模型，使研究人员易于理解数

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。