深度学习：归一化

最新推荐文章于 2024-04-25 10:57:19 发布

小马帅就是我没错了

最新推荐文章于 2024-04-25 10:57:19 发布

阅读量778

点赞数

分类专栏：深度学习基本概念

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33876194/article/details/87864532

版权

深度学习基本概念专栏收录该内容

6 篇文章 0 订阅

订阅专栏

深度学习中的归一化

批量归一化
自归一化网络

主要内容与结构

主要内容：归一化问题
结构：

深度模型的激活函数
激活函数导致的梯度消失
sigmoid
tanh
relu
ELU
批量归一化
层输出对下一层的影响
每一层的梯度都与来自前一层的输入有关。避免梯度消失
批归一化+仿射变换层（线性层）：防止将那些本该在平坦区域却被我们归一化变换到梯度不平坦的区域带来的影响；同时保持网络稳定（让输入稳定）
优点：降低了模型训练中的协变转移；防止由于数据噪音造成的梯度消失；保有原模型的表达能力
自归一化网络

所以，如果网络中隐藏层神经元总可以保持输入随机变量的均值和方差稳定不变，那么：训练网络将不会出现梯度爆炸和消失；每一层的输入也将保持稳定的分布，从而达到批量归一化减小协变偏移的效果。

给ELU乘上一个 $\lambda$ 且 $\lambda>1$

（中心极限和banach不动点定理）

小马帅就是我没错了

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习：归一化

深度学习中的归一化批量归一化自归一化网络主要内容与结构主要内容：归一化问题结构：深度模型的激活函数激活函数导致的梯度消失sigmoidtanhreluELU批量归一化层输出对下一层的影响每一层的梯度都与来自前一层的输入有关。避免梯度消失批归一化+仿射变换层（线性层）：防止将那些本该在平坦区域却被我们归一化变换到梯度不平坦的区域带来的影响；同时保持网络稳定（让输入...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。