数据挖掘之特征工程

最新推荐文章于 2020-03-28 21:42:41 发布

qq_33404619

最新推荐文章于 2020-03-28 21:42:41 发布

阅读量279

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33404619/article/details/105081524

版权

1.什么是特征工程：

是对原始数据进行一系列工程处理，将其提炼为特征，作为输入供算法和模型使用。从本质上来讲，特征工程是一个表示和展现数据的过程。在实际工作中，特征工程旨在去除原始数据中的杂质和冗余，设计更高效的特征以刻画求解的问题与预测模型之间的关系。

特征工程有很多的方法,其中比较常见的有：

1.1 特征归一化

为了消除数据特征之间的量纲影响，我们需要对特征进行归一化处理，使得不同指标之间具有可比性。

（ 1 ）线性函数归一化（ Min-Max Scaling ）。它对原始数据进行线性变换使结果映射到[0, 1] 的范围实现对原始数据的等比缩放。

归一化公式如下

value = max-min/max

其中 X 为原始数据， X max 、 X min 分别为数据最大值和最小值。

（ 2 ）零均值归一化（ Z-Score Normalization ）。它会将原始数据映射到均值为 0、标准差为 1 的分布上。具体来说，假设原始特征的均值为 μ 、标准差为 σ ，那么归一化公式定义为:

value = x- μ/σ

在实际应用中，通过梯度下降法求解的模型通常是需要归一化的，包括线性回归、逻辑回归、支持向量机、神经网络等模型。但对于决策树模型则并不适用，以C4.5为例.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据挖掘之特征工程

1.什么是特征工程：是对原始数据进行一系列工程处理，将其提炼为特征，作为输入供算法和模型使用。从本质上来讲，特征工程是一个表示和展现数据的过程。在实际工作中，特征工程旨在去除原始数据中的杂质和冗余，设计更高效的特征以刻画求解的问题与预测模型之间的关系。特征工程有很多的方法,其中比较常见的有： 1.1特征归一化 ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。