深度学习（10）：Batch Norm Batch归一化

awake020

于 2020-04-19 17:29:56 发布

阅读量401

点赞数 1

分类专栏：深度学习笔记文章标签：神经网络深度学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44334615/article/details/105617995

版权

在之前的学习中，我们知道对于训练集X进行归一化有利于我们把代价函数从扁平拉圆，便于我们训练。
那我们想一下，如果对每层神经网络的输出，我都搞一个归一化，是不是会提升我们的学习效果呢？
Batch Norm技术就出现了

实现方式

对于之前的每个神经元，我们计算z=w^Ta_pre, a=g(z)。在Batch Norm中，对于每一个神经元：

z=w^Ta_pre (没有b的原因是反正都要归一化，无论b取何值，都会体现在下面的平均值当中被减掉)

对于一组mini-batch上的所有数据，我们计算出Z的平均值：
在这里插入图片描述
计算出Z的方差：

对其进行归一化，得到
Z_norm = （Z-μ）/sqrt（σ²+ε）, 这里的ε是一个小常数（1e-8），为的是防止除0

为了避免始终保持均值为0，方差为1，失去活力，对每个Z_norm
Z^~= Z_norm*α +β
这里的α和β起到调整每个神经元均值和方差的作用，而β也能起到之前删去的b的作用。注意对于不同的神经元α，β均不同࿰

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习（10）：Batch Norm Batch归一化

在之前的学习中，我们知道对于训练集X进行归一化有利于我们把代价函数从扁平拉圆，便于我们训练。那我们想一下，如果对每层神经网络的输出，我都搞一个归一化，是不是会提升我们的学习效果呢？Batch Norm技术就出现了实现方式对于之前的每个神经元，我们计算z=wTa_pre, a=g(z)。在Batch Norm中，对于每一层神经元：z=wTa_pre (没有b的原因是反正都要归一化...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。