深度学习-六种权重初始化

最新推荐文章于 2024-06-24 10:13:57 发布

idotc

最新推荐文章于 2024-06-24 10:13:57 发布

阅读量3k

点赞数 4

分类专栏：深度学习实践文章标签：深度学习权重初始化基础理论实践

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_21578849/article/details/94305981

版权

权重初始化对深度学习模型的训练至关重要，影响梯度传播和收敛速度。本文介绍了六种初始化方法：0初始化导致梯度消失；高斯随机初始化要考虑梯度弥散问题；Xavier初始化保证各层权重方差一致；MSRA初始化针对ReLU激活函数优化；高斯随机初始化结合BN层能有效训练；预训练模型的迁移学习也是常见策略。

摘要由CSDN通过智能技术生成

模型权重的初始化对于网络的训练很重要, 不好的初始化参数会导致梯度传播问题, 降低训练速度; 而好的初始化参数, 能够加速收敛, 并且更可能找到较优解。

六种权重初始化

一、W初始化为0

在线性回归和logistics回归中可以使用，因为隐藏层只有一层。在超过一层的神经网络中就不能够使用了。因此如果所有的权重参数都为0，那么所有的神经元输出都是一样的，在back propagation的时候向后传递的梯度也是一致的，将无法发挥多层的效果，实际上相当于一层隐藏层。

二、W高斯随机初始化

我们来分析一层卷积：
在这里插入图片描述
其中ni表示输入个数。
那么方差为下面这个公式：

在前向网络中，W*X，如果W初始化为一个小于1的值，在训练过程中会导致会出现梯度弥散的情况，高层的神经元方差和均值趋于0，从而不被激活。但是如果把权重初始成一个比较大的值，大于1。则会造成前向传播时，神经元要么被抑制，要么被饱和。梯度更新时，

最低0.47元/天解锁文章

关注

4
点赞
踩
22

收藏

觉得还不错? 一键收藏
1
评论
深度学习-六种权重初始化

模型权重的初始化对于网络的训练很重要, 不好的初始化参数会导致梯度传播问题, 降低训练速度; 而好的初始化参数, 能够加速收敛, 并且更可能找到较优解。六种权重初始化一、W初始化为0在线性回归和logistics回归中可以使用，因为隐藏层只有一层。在超过一层的神经网络中就不能够使用了。因此如果所有的权重参数都为0，那么所有的神经元输出都是一样的，在back propagation的时候...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。