https://blog.csdn.net/huwenxing0801/article/details/82791879
可以看见使用交叉熵作为损失函数后,反向传播的梯度不在于sigmoid函数的导数有关了。这就从一定程度上避免了梯度消失。
04-15
9628
https://blog.csdn.net/huwenxing0801/article/details/82791879
可以看见使用交叉熵作为损失函数后,反向传播的梯度不在于sigmoid函数的导数有关了。这就从一定程度上避免了梯度消失。