神经网络的权重初始化

最新推荐文章于 2024-03-15 16:07:03 发布

VIP文章编码视界

最新推荐文章于 2024-03-15 16:07:03 发布

阅读量3.8k

点赞数 1

分类专栏： machine-learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Jing_xian/article/details/78985352

版权

权重初始化的合理与否常常决定了训练时网络能否收敛。常用的神经网络权重初始化方法有xavier和msra。由于基于的激活函数的假设不一样，msra的方差是xavier的2倍。

xavier初始化基于线性激活函数，线性激活函数相当于没有激活函数。原始论文发表于2010年，当时卷积神经网络尚未被引爆，因此是基于多层感知器网络的。假使论文的读者以为是基于卷积神经网络，可能对其中的个别符号会有误解。例如在论文中，fin_in被标记为n(l)和n(l+1)，这个标记默认了这一层fin_out等于下一层的fin_in。对于CNN中的某一个卷积层：
fin_in = k_h*k_w*c_in
fin_out=k_h*k_w*c_out（注：fin_out在卷积层的stride大于1时存疑）
前后层的卷积核尺寸差异会导致上面的条件不满足。只有在全连接网络，输入和输出特征图的空间尺寸是1x1，使得：
k_h=k_w=1
fin_in=c_in=n(l)
fin_out=c_out=n(l+1)
xavier初始化使用的是均匀分布：
这里写图片描述
对应的caffe实现代码：

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
神经网络的权重初始化

权重初始化的合理与否常常决定了训练时网络能否收敛。常用的神经网络权重初始化方法有xavier和msra。由于基于的激活函数的假设不一样，msra的方差是xavier的2倍。xavier初始化基于线性激活函数，线性激活函数相当于没有激活函数。原始论文发表于2010年，当时卷积神经网络尚未被引爆，因此是基于多层感知器网络的。假使论文的读者以为是基于卷积神经网络，可能对其中的个别符号会有误解。例如在
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。