r语言归一化_数据变换-归一化与标准化

最新推荐文章于 2022-10-20 13:09:27 发布

VIP文章 Hu??

最新推荐文章于 2022-10-20 13:09:27 发布

阅读量7.1k

点赞数 2

文章标签： r语言归一化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39800918/article/details/113681995

版权

一般在机器学习的模型训练之前，有一个比较重要的步骤是数据变换。

因为，一般情况下，原始数据的各个特征的值并不在一个统一的范围内，这样数据之间就没有可比性。

数据变换的目的是将不同渠道，不同量级的数据转化到统一的范围之内，方便后续的分析处理。

数据变换的方法有很多，比如数据平滑，数据聚集，数据概化，数据规范化和属性构造等。

本篇文章主要介绍数据规范化，这是一种比较常用，也比较简单的方法。

数据规范化是使属性数据按比例缩放，这样就将原来的数值映射到一个新的特定区域中，包括归一化，标准化等。

1，数据归一化

归一化就是获取原始数据的最大值和最小值，然后把原始值线性变换到 [0,1] 范围之内，变换公式为：

bbe073c792dd

其中：

x 是当前要变换的原始值。

min 是当前特征中的最小值。

max 是当前特征中的最大值。

x' 是变换完之后的新值。

注意：

min 和 max 是指当前特征中的最小最大值。

所以同一特征之内，最小最大值是一样的。

而不同特征之间，最小最大值是不一样的。

从公式中可以看出，归一化与最大最小值有关，这也是归一化的缺点，因为最大值与最小值非常容易受噪音数据的影响。

1.1，归一化处理

比如&#

最低0.47元/天解锁文章

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
r语言归一化_数据变换-归一化与标准化

一般在机器学习的模型训练之前，有一个比较重要的步骤是数据变换。因为，一般情况下，原始数据的各个特征的值并不在一个统一的范围内，这样数据之间就没有可比性。数据变换的目的是将不同渠道，不同量级的数据转化到统一的范围之内，方便后续的分析处理。数据变换的方法有很多，比如数据平滑，数据聚集，数据概化，数据规范化和属性构造等。本篇文章主要介绍数据规范化，这是一种比较常用，也比较简单的方法。数据规范化是使属性数...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。