深度学习《激励函数》你了解透了吗？

最新推荐文章于 2020-04-21 14:48:05 发布

wuyouyin123

最新推荐文章于 2020-04-21 14:48:05 发布

阅读量325

点赞数 1

分类专栏：深度学习基础知识文章标签：深度学习机器学习神经网络 tensorflow python

本文链接：https://blog.csdn.net/wuyouyin123/article/details/105547706

版权

深度学习基础知识专栏收录该内容

8 篇文章 1 订阅

订阅专栏

为了说清楚问题，画了如下图帮助理解。

如果lossFunction 是 mse，真值为z_true，loss = ( z_true - z ) ** 2
d(loss)/d(z) = 2(z - z_true)
d(z)/d(y) = sigmoid’(z)
d(y)/d(w) = x
d(y)/d(b) = 1
d(loss)/d(w) = d(loss)/d(z) * d(z)/d(y) * d(y)/d(w) = 2(z - z_true) * sigmoid’(z) * x
d(loss)/d(b) = d(loss)/d(z) * d(z)/d(y) * d(y)/d(w) = 2(z - z_true) * sigmoid’(z) * 1

================================================================
如果lossFunction 是 binary_cross_entropy，真值为z_true，
loss = - [ z_true * log(z) + (1 - z_true) * log( 1 - z ) ]
d(loss)/d(z) = - z_true / z + (1 - z_true) / (1-z)
如果 z_true == 1 则 d(loss)/d(z) = -1/z
如果 z_true == 0 则 d(loss)/d(z) = 1/(1-z)
d(z)/d(y) = sigmoid’(z) = z * (1-z) (这个就是sigmoid的导数，下面有推导过程)
d(y)/d(w) = x
d(y)/d(b) = 1
如果 z_true == 1 则
d(loss)/d(w) = d(loss)/d(z) * d(z)/d(y) * d(y)/d(w) = -1/z * z * (1-z) * x = (z-1)*x
d(loss)/d(b) = d(loss)/d(z) * d(z)/d(y) * d(y)/d(b) = -1/z * z * (1-z) * 1 = (z-1)
如果 z_true == 0 则
d(loss)/d(w) = d(loss)/d(z) * d(z)/d(y) * d(y)/d(w) = 1/(1-z) * z * (1-z) * x = （z - 0）*x
d(loss)/d(b) = d(loss)/d(z) * d(z)/d(y) * d(y)/d(b) = 1/(1-z) * z * (1-z) * 1 = ( z - 0 ）
合并之后：
d(loss)/d(w) = ( z - z_true ) * x
d(loss)/d(b) = ( z - z_true )

.
.
###sigmoid函数求导过程如下：
在这里插入图片描述

如果是多分类，则激励函数为softmax，
那么softmax 又和 sigmoid 有什么关系那？
在这里插入图片描述

wuyouyin123

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习《激励函数》你了解透了吗？

为了说清楚问题，画了如下图帮助理解。================================================================如果lossFunction 是 mse，真值为z_true，loss = ( z_true - z ) ** 2d(loss)/d(z) = 2(z - z_true)d(z)/d(y) = sigmoid’(z)d(y)...
复制链接

扫一扫