神经网络的参数初始化

最新推荐文章于 2023-07-27 11:23:52 发布

明日何其多_

最新推荐文章于 2023-07-27 11:23:52 发布

阅读量206

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qsmx666/article/details/104867332

版权

深度学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

权重初始化是为了缓解深层神经网络中产生的梯度消失和梯度爆炸问题，加快收敛速率。它主要有以下几种方式。

零值初始化

这是一种非常不可取的初始化方式。因为这样一来，所有的隐藏单元都是一样的（对称性），也就意味着它们计算的是同样的函数，对输出单元有同样的影响。无论经过多少次迭代，所有隐藏单元学习到的内容都是相同的，这样的神经网络效果和简单的线性分类器无异。

随机初始化

随机初始化打破了对称性，效果远优于零值初始化，一般用np.random.randn()方法实现。一般来说，初始化参数不宜过大。

Xavier 初始化

Xavier初始化适用于tanh激活函数，是在随机初始化的基础上再乘上一个参数 $np.sqrt(\frac{1}{n^{[l-1]}})$ （ $n^{[l-1]}$ 是第 $l - 1$ 层的隐藏单元个数）。

He 初始化

与Xavier初始化类似，He初始化是在随机初始化的基础上乘上 $np.sqrt(\frac{2}{n^{[l-1]}})$ ，适用于relu激活函数。

初始化方式不同，训练结果也会有很大的不同。
以下是三种初始化方式应用于一个3层神经网络上的效果，可以看到准确率的差异是很大的。
在这里插入图片描述
（来源：吴恩达深度学习课程作业）

明日何其多_

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
神经网络的参数初始化

权重初始化是为了缓解深层神经网络中产生的梯度消失和梯度爆炸问题，加快收敛速率。它主要有以下几种方式。零值初始化这是一种非常不可取的初始化方式。因为这样一来，所有的隐藏单元都是一样的（对称性），也就意味着它们计算的是同样的函数，对输出单元有同样的影响。无论经过多少次迭代，所有隐藏单元学习到的内容都是相同的，这样的神经网络效果和简单的线性分类器无异。随机初始化随机初始化打破了对称性，效果远优于...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。