如何给工业大数据降维去噪，你可以试试特征选择

getech

于 2019-06-26 10:49:35 发布

阅读量1.7k

点赞数 1

文章标签：工业互联网智能制造工业大数据格创东智特征选择

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/getech/article/details/93719891

版权

本文介绍了特征选择在工业大数据降维去噪中的应用，包括特征选择的功能、流程、方法，如过滤法、包装法和嵌入法，并举例说明了各种方法的选择标准。特征选择有助于提高模型泛化能力，降低过拟合风险。

摘要由CSDN通过智能技术生成

在之前格物汇的文章中，我们介绍了特征构建的几种常用方法。特征构建是一种升维操作，针对特征解释能力不足，可以通过特征构建的方法来增加特征解释力，从而提升模型效果。随着近几年大数据技术的普及，我们可以获取海量数据，但是这些海量数据带给我们更多信息的同时，也带来了更多的噪音和异常数据。如何降维去噪成为很多企业关注的焦点，今天我们将介绍特征工程中的一种降维方法——特征选择。

什么是特征选择

特征选择( Feature Selection )也称特征子集选择( FeatureSubset Selection , FSS )，或属性选择( Attribute Selection )。是指从已有的N个特征(Feature)中选择M个特征使得系统的特定指标最优化。
在这里插入图片描述
特征选择主要有两个功能：
减少特征数量、降维，使模型泛化能力更强，减少过拟合
增强对特征和特征值之间的理解

特征选择的流程

特征选择的目标是寻找一个能够有效识别目标的最小特征子集。寻找的一般流程可用下图表示：
在这里插入图片描述
一般来说，通过枚举来对特征子集进行选择是一个比较费时的步骤,所以应使用一些策略来进行特征选择，通常来说，我们会从两个方面考虑来选择特征：
特征是否发散：
如果一个特征不发散，例如方差接近于0，

最低0.47元/天解锁文章

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。