深度学习入门--标准化，归一化，零均值化

最新推荐文章于 2024-08-05 11:28:49 发布

_知行

最新推荐文章于 2024-08-05 11:28:49 发布

阅读量4.6k

点赞数 1

分类专栏：深度学习文章标签： deep learning 深度学习入门机器学习神经网络标准化

本文链接：https://blog.csdn.net/ZQinjin/article/details/86472372

版权

深度学习专栏收录该内容

19 篇文章 0 订阅

订阅专栏

我们在训练模型之前，有一个可以加快训练速度的方法，那就是对训练数据集进行标准化处理。

为什么需要标准化

z-score标准化

假设数据集的每一个训练样本只有两个特征x1、x2，那么训练集：
$X=\begin{bmatrix} x_{1}^{(1)} & x_{1}^{(2)} & ... & x_{1}^{(m)} \\ x_{2}^{(1)} & x_{2}^{(2)}& ... & x_{2}^{(m)} \end{bmatrix}$ 原始数据集

绘制出的图形如图所示，要对其进行标准化分为两步：

1、对训练集进行零均值化处理，顾名思义，也就是处理后的数据集的均值为零。
2、归一化方差。即使方差变为1。

#####分步讲解：
1、怎样来使均值变为0呢？首先我们需要算出数据集的平均值：

$\mu =\sum_{i=1}^{m}\left ( X^{i} \right )$

求得的均值是一个向量，这里的x1是所有训练样本x1的均值。x2同理：

$\mu =\begin{bmatrix}x_{1}\\ x_{2}\end{bmatrix}$

然后用数据集的每一项减去这个均值就可以使整个数据集的均值为0了。

$X=X-\mu$
所得X如下所示：
$X=\begin{bmatrix} x_{1}^{(1)}-x_{1} & x_{1}^{(2)}-x_{1} & ... & x_{1}^{(m)}-x_{1} \\ x_{2}^{(1)}-x_{2} & x_{2}^{(2)}-x_{2}& ... & x_{2}^{(m)}-x_{2} \end{bmatrix}$ 去均值化后的数据集
2、要使方差为1，方差也就是数据偏离均值的程度，观察图（1）第二张图，这是经过零均值化处理后的数据集，现在x1和x2的均值都为0，我们看x1偏离原点（即均值）的程度是不是要大于x2。我们要对其处理以使x1、x2方差都为1。我们首先算出数据集的方差。然后用数据集除以方差即可。
$\sigma ^{2}=\frac{1}{m}\sum_{i=1}^{m}\left ( X^{i} \right )^{2}$
$X=\frac{X}{\sigma ^{2}}$ 归一化方差后的数据集