机器学习中的标准化/归一化

最新推荐文章于 2024-08-05 11:28:49 发布

Joy_Shen

最新推荐文章于 2024-08-05 11:28:49 发布

阅读量1.2w

点赞数 3

分类专栏： Python Machine Learning 文章标签： python 机器学习归一化标准化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/index20001/article/details/78044971

版权

数据标准化是将数据按比例缩放，常用于加速梯度下降的收敛速度和提高模型精度。常见的方法有线性归一化（min-max normalization）和标准差标准化（z-score standardization）。非线性归一化如log、指数和反正切函数则适用于数据分化较大的场景。归一化处理能够帮助优化模型性能，特别是在计算样本间距离和使用梯度下降法时显得尤为重要。

摘要由CSDN通过智能技术生成

数据的标准化（normalization）是将数据按比例缩放，使之落入一个小的特定区间。在一些数据比较和评价中常用到。典型的有归一化法，还有比如极值法、标准差法。

归一化方法的主要有两种形式：一种是把数变为（0，1）之间的小数，一种是把有量纲表达式变为无量纲表达式。在数字信号处理中是简化计算的有效方式。

归一化处理的好处：

1 加快梯度下降的求解速度，即提升模型的收敛速度

两个特征区间相差非常大时，如左图中的x1[0-2000]和x2[1-5]，形成的等高线偏椭圆，迭代时很有可能走“之字型”路线（垂直长轴），从而导致需要迭代很多次才能收敛。

而右图对两个特征进行了归一化，对应的等高线就会变圆，在梯度下降进行求解时能较快的收敛。

因此在机器学习中使用梯度下降法求最优解时，归一化也很有必要，否则模型很难收敛甚至有时不能收敛。

2 有可能提高模型的精度

一些分类器需要计算样本之间的距离，如果一个特征的值域范围非常大，那么距离计算就会主要取决于这个特征，有

最低0.47元/天解锁文章

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。