计算机视觉与深度学习-全连接神经网络-训练过程-批归一化- [北邮鲁鹏]

我要成果

已于 2023-09-18 20:24:14 修改

阅读量735

点赞数 1

分类专栏：深度学习 # 计算机视觉文章标签：深度学习神经网络人工智能批归一化

于 2023-09-14 10:52:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_49683806/article/details/132870559

版权

计算机视觉同时被 2 个专栏收录

18 篇文章 1 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

文章目录

思想
批归一化操作
批归一化与梯度消失
- 经过BN处理
算法实现

思想

直接对神经元的输出进行批归一化

在这里插入图片描述
批归一化：对输出值进行归一化，将归一化结果平移缩放作为输出。

批归一化操作

小批量梯度下降算法回顾：每次迭代时会读入一批数据，比如32个样本；经过当前神经元后会有32个输出值y₁,…y₃₂。
批归一化操作：对这32个输出进行减均值初方差操作；可保证当前神经元的输出值的分布符合0均值1方差。
如果每一层的每个神经元进行批归一化，就能解决前向传递过程中的信号消失问题。

批归一化与梯度消失

实际操作中，经常将批归一化放在全连接层之后，非线性激活前。
在这里插入图片描述
FC：全连接层就是wx+b

经过BN处理

在这里插入图片描述
批归一化解决两个问题：

保证前向传播中信息流通畅，不至于让数据变为0导致的数据不能到达输出层。因为每次归一化后数据都会将很小的数据，变得不那么小。
保证反向传播中信息流通畅，可以有效的防止梯度消失现象发生。因为每次归一化后梯度都会变得很有效

算法实现

在这里插入图片描述
参数解释：

问题：输出的0均值1方差的正态分布是最有利于网络分类的分布吗？

根据对分类的贡献自行决定数据分布的均值与方差

平移缩放的作用

可以使网络自行选择数据分布的均值和方差，γ决定方差，β决定期望。γ和β是学习参数，不是超参数，需要神经网络学习得出。

问题：单张样本测试时，均值和方差怎么设置？

来自训练中。累加训练中每个批次的均值和方差，最后进行平均，用平均后的结果作为预测时的均值和方差。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
计算机视觉与深度学习-全连接神经网络-训练过程-批归一化- [北邮鲁鹏]

可以使网络自行选择数据分布的均值和方差，γ决定方差，β决定期望。批归一化操作：对这32个输出进行减均值初方差操作；可保证当前神经元的输出值的分布符合0均值1方差。累加训练中每个批次的均值和方差，最后进行平均，用平均后的结果作为预测时的均值和方差。如果每一层的每个神经元进行批归一化，就能解决前向传递过程中的信号消失问题。问题：输出的0均值1方差的正态分布是最有利于网络分类的分布吗？批归一化：对输出值进行归一化，将归一化结果平移缩放作为输出。实际操作中，经常将批归一化放在全连接层之后，非线性激活前。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。