Xavier初始化方法简要笔记

Blateyang

于 2018-05-02 21:04:54 发布

阅读量3.3k

点赞数

分类专栏：深度学习文章标签： Xavier 初始化方法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Blateyang/article/details/80172016

版权

深度学习专栏收录该内容

23 篇文章

订阅专栏

Xavier[发音 ‘zeɪvɪr]初始化方法是深度学习中比较常用和有效的一种权重初始化方法，其名字是以其发明者命名的。
它的基本设计原则是为了使网络中的信息更好地流动，网络各层激活值及状态梯度的方差应尽量保持不变。
根据一些前提假设以及概率统计公式推导出满足上述设计原则的权重W应服从

又由于实际当中输入、输出的个数n往往不相等，为了综合考虑，将W的方差初始化为
当W用对称区间的均匀分布生成时，根据 $\frac{(b-a)^2}{12}=\frac{2}{n_i+n_{i+1}}，b=-a$ 求出的分布参数的范围就是

Xavier初始化方法的不足之处：
因为Xavier的推导过程是基于几个假设的，其中一个是是激活值关于0对称，这个不适用于sigmoid函数和ReLU函数。

参考资料：
1. 深度学习——Xavier初始化方法- CSDN博客
2. 深度学习之参数初始化（一）——Xavier初始化

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。