数据的归一化和标准化处理

最新推荐文章于 2024-03-11 17:23:39 发布

皮皮猪QAQ

最新推荐文章于 2024-03-11 17:23:39 发布

阅读量1.7k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39037383/article/details/89075270

版权

机器学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

我们为什么要进行归一化处理
当我们在采集样本与使用样本进行算法预测时，是否发现得到的模型存在过拟合或者欠拟合，这时我们要分析我们的数据是否需要预处理操作，我们通常使用下面两种方法来解决：
1.归一化正是使用减少参数的重要性的方式，来增强模型的泛化能力，并且可以保证特征数量保持不变。
2.手动选择保留哪些特征值或者使用一些选择特征算法来解决

归一化处理
归一化有可能提高精度（归一化是让不同维度之间的特征在数值上有一定的比较性）。

一些分类器需要计算样本之间的距离（如欧式距离），例如KNN。如果一个特征值域范围非常大，那么距离计算就主要取决于这个特征，从而与实际情况不符。（比如，这时实际情况是值域范围小的特征更重要）。
在这里插入图片描述
将数据映射到(0,1)区间上，实现归一化。
归一化的计算过程为：真实值-最小值/最大值-最小值

数据的标准化处理
数据标准化的数学计算过程为 x-(mean)/std
在这里插入图片描述
这里要注意归一化后的数字都是在(0,1)区间上的，而标准化则可能出现负数。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
数据的归一化和标准化处理

我们为什么要进行归一化处理当我们在采集样本与使用样本进行算法预测时，是否发现在数据中某些
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。