神经网络Xavier随机初始化

本文深入探讨了Xavier初始化方法,一种用于深度学习网络权重初始化的技术。该方法旨在确保信息在网络中顺畅流动,使各层输出的方差保持一致,不受输入或输出节点数量的影响。通过均匀分布随机采样权重,Xavier初始化有助于稳定训练过程。
摘要由CSDN通过智能技术生成

该方法来源于2010年的论文Understanding the difficulty of training deep feedforward neural network
该方法的思想是:为了使得网络中信息更好的流动,每一层输出的方差应该尽量相等
具体的推导过程见如下链接:
深度学习——Xavier初始化方法
深度学习中Xavier初始化
推导所得的结果就是使该层中权重参数的每个元素都随机采样于均匀分布:
U ( − 6 a + b , 6 a + b ) U(-\sqrt{\frac{6}{a+b}},\sqrt{\frac{6}{a+b}}) U(a+b6 ,a+b6 )
其中a是该层的输入个数,b是该层的输出个数,它的设计主要考虑到,模型参数初始化后,每层输出的方差不该受该层输入个数影响,且每层梯度的方差也不该受该层输出个数影响。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值