激活函数以零为中心的影响

最新推荐文章于 2023-09-18 22:28:27 发布

IQ等于猪

最新推荐文章于 2023-09-18 22:28:27 发布

阅读量3.5k

点赞数

神经网络激活函数输出不以0为中心会导致收敛过慢，为什么？

关于激活函数，上一篇文章已经有说明，链接https://mp.csdn.net/postedit/83511901

如果上一级神经元采用 Sigmoid 函数作为激活函数，x0和下一层的x1符号均为相同的。此时，模型为了收敛，不得不向逆风前行的风助力帆船一样，走 Z 字形逼近最优解。

模型参数走绿色箭头能够最快收敛，但由于输入值的符号总是为正，所以模型参数可能走类似红色折线的箭头。如此一来，使用 Sigmoid 函数作为激活函数的神经网络，收敛速度就会慢上不少了。

reference https://liam.page/2018/04/17/zero-centered-active-function/

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
激活函数以零为中心的影响

神经网络激活函数输出不以0为中心会导致收敛过慢，为什么？关于激活函数，上一篇文章已经有说明，链接https://mp.csdn.net/postedit/83511901如果上一级神经元采用 Sigmoid 函数作为激活函数，x0和下一层的x1符号均为相同的。此时，模型为了收敛，不得不向逆风前行的风助力帆船一样，走 Z 字形逼近最优解。 ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。