Deep learning系列（八）参数初始化

最新推荐文章于 2024-04-20 01:50:36 发布

VIP文章 du_mengnan

最新推荐文章于 2024-04-20 01:50:36 发布

阅读量6.5k

点赞数 1

分类专栏： deep-learning 文章标签：深度学习 initialization 参数初始化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012526120/article/details/49153683

版权

0. 引言

在主成分分析与白化一节中介绍了如何对输入数据进行预处理，在这节中介绍与之类似的另一个问题，参数初始化（Weight Initialization）。

在模型训练之初，我们不知道参数的具体分布，然而如果数据经过了合理的归一化（normalization）处理后，对于参数的合理猜测是其中一半是正的，另一半是负的。然后我们想是不是把参数都初始化为0会是比较好的初始化？这样做其实会带来一个问题，经过正向传播和反向传播后，参数的不同维度之间经过相同的更新，迭代的结果是不同维度的参数是一样的，严重地影响了模型的性能。

1. 小的随机数

我们仍然想要参数接近于0，又不是绝对的0，一种可行的做法是将参数初始化为小的随机数，这样做可以打破对称性（symmetry breaking）。python代码如下：

nn_input_dim = 2
nn_hdim = 3
W = 0.001* np.random.randn(nn_input_dim,nn_hdim)

其中randn从均值为0，标准差是1的高斯分布中取样，这样，参数的每个维度来自一个多维的高斯分布。需要注意的是参数初始值不能取得太小，因为小的参数在反向传播时会导致小的梯度，对于深度网络来说，也会产生梯度弥散问题，降低参数的收敛速度。

2. 将方差乘以 1/sq

最低0.47元/天解锁文章

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Deep learning系列（八）参数初始化

介绍了在实际应用中，神经网络参数如何进行初始化。
复制链接

扫一扫

专栏目录

du_mengnan CSDN认证博客专家 CSDN认证企业博客

码龄11年

22: 原创

17万+: 周排名

73万+: 总排名

20万+: 访问

: 等级

1812: 积分

187: 粉丝

69: 获赞

15: 评论

135: 收藏

私信

关注

热门文章

分类专栏

最新评论

Deep learning系列（十四）Layer和solver中参数详解
Liu1998121: 请问这里的Solver参数是表示优化器的参数吗？
deeplearning系列（三）梯度检验
川流不息的川: 您好主要是想问一下，什么时候用这个梯度检验。是在训练模型的过程中，即迭代更新了指定轮数时，求近似解是否与解析解相同；还是等模型已经跑完得出参数之后，在根据之前的公式和已有参数求一遍解析解，然后求得对应近似解，来比对检验整个过程呢？
Deep learning系列（十五）有监督和无监督训练
tmac尚: 所以要知其然而知其所以然，解决了我的困惑！！赞大佬
deeplearning系列（一）浅层神经网络
泡泡堂6688: 不错不错
deeplearning系列（五）实现一个简单的深度神经网络
weixin_42896296: 想问一下博主程序中feedForwardAutoencoder这个变量是在哪定义的？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。