归一化输入时需要按照特征值分别计算（附归一化代码）

最新推荐文章于 2022-07-09 11:32:22 发布

Tim_Van

最新推荐文章于 2022-07-09 11:32:22 发布

阅读量824

点赞数 2

分类专栏： Python 深度学习文章标签：人工智能神经网络深度学习 python

本文链接：https://blog.csdn.net/TimVan1596/article/details/121366593

版权

Python 同时被 2 个专栏收录

10 篇文章 2 订阅

订阅专栏

深度学习

8 篇文章 0 订阅

订阅专栏

该博客讨论了在深度学习中对输入数据进行零均值和归一化处理的重要性。作者指出，应当按特征值分别计算均值和方差，以避免小值被近似为0，确保数据的有效归一化。提供的代码示例展示了如何使用numpy实现这一过程，对输入数据进行归一化处理。

摘要由CSDN通过智能技术生成

结论

需要按照特征值 $x_{1},x_{2},...,x_{n}$ 分别求取均值和方差，然后再做零均值和归一化方差处理。

原因

在学习《吴恩达·深度学习》第二门课 1.9 归一化输入时，遇到一个问题。视频里说均值 $\mu$ 和 $\sigma ^{2}$ 都是一个向量。但我不是很理解到底是不是按照特征值分别求取，再分别放缩。

群里老兄点拨，假设对整个矩阵求均值和方差，再减去和除以，可能会导致原来比较小的值近似为0。不符合归一化输入处理的目的。因此需要按特征值分别求取。

视频笔记：

1.9 归一化输入（Normalizing inputs）http://www.ai-start.com/dl2017/html/lesson2-week1.html#header-n227http://www.ai-start.com/dl2017/html/lesson2-week1.html#header-n227

编码

import numpy as np

# 对传入数据进行归一化处理
# data的shape应该是(x,m)，其中x是特征值的个数，m是样本数量
def normalizing(data: np.ndarray):
    # m = 样本数量
    m = data.shape[1]
    # 1.零均值：对每一个特征值分别求均值
    u = (1 / m) * data.sum(axis=1, keepdims=True)
    cache = data - u

    # 2.归一化方差：注意，是先平方再求和，这是为了避免如[-1,0,1]数据造成求和为0，之后产生除以0
    delta_double = (1 / m) * (cache ** 2).sum(axis=1, keepdims=True)
    cache = cache / delta_double
    return cache


if __name__ == '__main__':
    # 输入的数组 shape=(2,3)
    arr = np.array([[1, 2, 3], [4, 5, 6]])
    print(normalizing(data=arr))

Tim_Van

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
归一化输入时需要按照特征值分别计算（附归一化代码）

结论需要按照特征值分别求取均值和方差，然后再做零均值和归一化方差处理。原因在学习《吴恩达·深度学习》第二门课 1.9归一化输入时，遇到一个问题。视频里说均值和都是一个向量。但我不是很理解到底是不是按照特征值分别求取，再分别放缩。群里老兄点拨，假设对整个矩阵求均值和方差，再减去和除以，可能会导致原来比较小的值近似为0。不符号归一化输入处理的目的。因此需要按特征值分别求取。1.9 归一化输入（Normalizing inputs）h...
复制链接

扫一扫

专栏目录