StandardScaler(sklearn)机器学习中的归一化

最新推荐文章于 2024-08-05 11:28:49 发布

闲人_Yty

最新推荐文章于 2024-08-05 11:28:49 发布

阅读量4.1k

点赞数 4

分类专栏：机器学习 sklearn 文章标签：机器学习 python

本文链接：https://blog.csdn.net/qq_40326280/article/details/112477082

版权

StandardScaler是机器学习中用于数据归一化的工具，确保数据的每个维度均值为0，方差为1，加速梯度下降的收敛并可能提高模型精度。本文详细介绍了StandardScaler的原理和使用，包括fit、transform和fit_transform方法。此外，还对比了不同的归一化方法，如Zero-mean normalization、Min-max normalization和非线性归一化等。

摘要由CSDN通过智能技术生成

StandardScaler(sklearn)参数详解

为什么要归一化

归一化后加快了梯度下降求最优解的速度：

如果机器学习模型使用梯度下降法求最优解时，归一化往往非常有必要，否则很难收敛甚至不能收敛。
归一化有可能提高精度：

一些分类器需要计算样本之间的距离（如欧氏距离），例如KNN。如果一个特征值域范围非常大，那么距离计算就主要取决于这个特征，从而与实际情况相悖（比如这时实际情况是值域范围小的特征更重要）。

from sklearn.preprocessing import StandardScaler
import numpy as np

StandardScaler()
标准化数据，保证每个维度数据方差为1.均值为0。使得据测结果不会被某些维度过大的特征值而主导。
$x^* = \frac{x - \mu}{\sigma}$

fit

用于计算训练数据的均值和方差，后面就会用均值和方差来转换训练数据
transform

很显然，它只是进行转换，只是把训练数据转换成标准的正态分布
fit_transform

不仅计算训练数据的均值和方差，还会基于计算出来的均值和方差来转换训练数据，从而把数据转换成标准的正态分布

    np.random<

最低0.47元/天解锁文章

闲人_Yty

关注

4
点赞
踩
15

收藏

觉得还不错? 一键收藏
1
评论
StandardScaler(sklearn)机器学习中的归一化

StandardScaler(sklearn)参数详解为什么要归一化归一化后加快了梯度下降求最优解的速度：如果机器学习模型使用梯度下降法求最优解时，归一化往往非常有必要，否则很难收敛甚至不能收敛。归一化有可能提高精度：一些分类器需要计算样本之间的距离（如欧氏距离），例如KNN。如果一个特征值域范围非常大，那么距离计算就主要取决于这个特征，从而与实际情况相悖（比如这时实际情况是值域范围小的特征更重要）。from sklearn.preprocessing import Standard
复制链接

扫一扫

专栏目录