【深度学习】说一说深度学习的weight initialization

最新推荐文章于 2021-08-10 15:13:39 发布

快乐成长吧

最新推荐文章于 2021-08-10 15:13:39 发布

阅读量619

点赞数

分类专栏：深度学习相关

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37791134/article/details/84938167

版权

先说一下干吗了？

感谢：

https://zhuanlan.zhihu.com/p/34879333 Batch Normalization原理与实战

https://www.leiphone.com/news/201703/3qMp45aQtbxTdzmK.html 谷歌工程师：聊一聊深度学习的weight initialization

深度学习模型训练的过程本质是对weight（即参数 W）进行更新，这需要每个参数有相应的初始值。有人可能会说：“参数初始化有什么难点？直接将所有weight初始化为0或者初始化为随机数！”对一些简单的机器学习模型，或当optimization function是convex function时，这些简单的方法确实有效。

初始化为0的可行性？

为什么将所有W初始化为0是错误的呢？是因为如果所有的参数都是0，那么所有神经元的输出都将是相同的，那在back propagation的时候同一层内所有神经元的行为也是相同的 --- gradient相同，weight update也相同。这显然是一个不可接受的结果。

可行的几种初始化方式

pre-training

pre-training是早期训练神经网络的有效初始化方法，一个便于理解的例子是先使用greedy layerwise auto-encoder做unsupervised pre-training，然后再做fine-tuning。具体过程可以参见UFLDL的一个tutorial（http://ufldl.

最低0.47元/天解锁文章

快乐成长吧

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【深度学习】说一说深度学习的weight initialization

先说一下干吗了？感谢：https://zhuanlan.zhihu.com/p/34879333Batch Normalization原理与实战https://www.leiphone.com/news/201703/3qMp45aQtbxTdzmK.html谷歌工程师：聊一聊深度学习的weight initialization 深度学习模型训练的过程本质是...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。