神经网络参数初始化-He初始化

最新推荐文章于 2024-03-06 18:03:40 发布

脚踏实地仰望星空

最新推荐文章于 2024-03-06 18:03:40 发布

阅读量6.3k

点赞数 6

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010505915/article/details/106608922

版权

本文介绍了He初始化方法，它源于何凯明的论文，针对ReLU激活函数，旨在保持正向传播和反向传播过程中状态值和梯度的方差不变。通过数学推导，得出权重应初始化为期望为0，标准差为的高斯分布，以避免指数效应。

摘要由CSDN通过智能技术生成

Glorot和Bengio提出了Xavier方法来初始化网络参数。该方法基于激活是线性的假设。但该假设对ReLU不适用。何凯明（He kaiming）在论文《Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification》中提出了针对 ReLU激活网络的初始化方法。

He初始化

与Xavier方法一样，He初始化方法也希望初始化使得正向传播时，状态值的方差保持不变；反向传播时，关于激活值的梯度的方差保持不变。

其初始化方法为：

其中，为第 l 层神经元个数。

论文：Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification

论文作者推导过程针对的是CNN网络的前向传播和反向传播过程。我们讨论全连接网络结构。

正向传播

正向传播为：

其中，为权重矩阵，为上一层的输出，

最低0.47元/天解锁文章

脚踏实地仰望星空

关注

6
点赞
踩
31

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。