神经网络损失函数公式解读

最新推荐文章于 2024-06-10 20:48:53 发布

weixin_33863087

最新推荐文章于 2024-06-10 20:48:53 发布

阅读量798

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/hoojjack/p/10494077.html

版权

原文地址：https://www.cnblogs.com/pinard/p/6437495.html

上面地址是一篇讲解DNN的文章，其中部分公式推导过程，自己在这里做一些记录，方便以后查阅。

上图公式由下两图公式得来，a^L = [ 1/ (1 + e^-z) ]对z的求导，用到了sigmoid函数，sigmoid函数求导后的结果 [ e^-z/ (1 + e^-z)²]，经过转换变成了（a^L)(1-a^L)。红色部分是巧妙点，所以softmax的交叉熵损失函数可以规避sigmoid函数导数为0的问题，解决了梯度消失问题。

转载于:https://www.cnblogs.com/hoojjack/p/10494077.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_33863087

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
神经网络损失函数公式解读

原文地址：https://www.cnblogs.com/pinard/p/6437495.html上面地址是一篇讲解DNN的文章，其中部分公式推导过程，自己在这里做一些记录，方便以后查阅。上图公式由下两图公式得来，aL= [ 1/ (1 + e-z) ]对z的求导，用到了sigmoid函数，sigmoid函数求导后的结果 [ e-z/ (1 + e-z)2]，经过转换变...
复制链接

扫一扫