Sklearn之数据预处理——StandardScaler归一化

最新推荐文章于 2023-03-14 17:39:57 发布

Lu_mi

最新推荐文章于 2023-03-14 17:39:57 发布

阅读量4.5k

点赞数

分类专栏：深度学习---数据分析文章标签：机器学习深度学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Lu_mi/article/details/108727204

版权

归一化在机器学习中至关重要，它可以加速梯度下降的求解过程，提高精度，尤其是对于依赖距离计算的算法如KNN。StandardScaler是一种常用的归一化方法，将数据转换为均值为0，标准差为1。线性函数、零均值标准化和非线性归一化（如对数、三角函数、sigmoid）是常见的归一化技术，适用于不同的场景。

摘要由CSDN通过智能技术生成

文章目录

为什么要进行归一化？
- 维基百科给出的解释：
- 我的理解：
哪些机器学习算法不需要(需要)做归一化?
- 下面列举一下常用的归一化方法以及各种方法的使用场景。

为什么要进行归一化？

机器学习模型被互联网行业广泛应用，一般做机器学习应用的时候大部分时间是花费在特征处理上，其中很关键的一步就是对特征数据进行归一化，为什么要归一化呢？

维基百科给出的解释：

归一化后加快了梯度下降求最优解的速度；

如果机器学习模型使用梯度下降法求最优解时，归一化往往非常有必要，否则很难收敛甚至不能收敛。

归一化有可能提高精度；

一些分类器需要计算样本之间的距离（如欧氏距离），例如KNN。如果一个特征值域范围非常大，那么距离计算就主要取决于这个特征，从而与实际情况相悖（比如这时实际情况是值域范围小的特征更重要）。

我的理解：

去掉量纲，使得各指标之间具有可比性
将数据先知道一定区间内，使得运算便捷

下面再以房价预测的例子来说明一下归一化的作用。以预测房价为例，自变量为房间数（x1）、面积大小（x2），因变量为房价。那么可以得到的公式为：
y=θ1x1+θ2x2
y=θ1x1+θ2x2
其中，x1代表房间数，θ1代表x1变量前面的系数；x2代表面积，θ2代表x2变量前面的系数。
下面两张图（损失函数的等高线）代表

最低0.47元/天解锁文章

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
1
评论
Sklearn之数据预处理——StandardScaler归一化

为什么要进行归一化？机器学习模型被互联网行业广泛应用，一般做机器学习应用的时候大部分时间是花费在特征处理上，其中很关键的一步就是对特征数据进行归一化，为什么要归一化呢？维基百科给出的解释：归一化后加快了梯度下降求最优解的速度；如果机器学习模型使用梯度下降法求最优解时，归一化往往非常有必要，否则很难收敛甚至不能收敛。归一化有可能提高精度；一些分类器需要计算样本之间的距离（如欧氏距离），例如KNN。如果一个特征值域范围非常大，那么距离计算就主要取决于这个特征，从而与实际情况相悖（比如这时
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。