交叉熵与softmax

最新推荐文章于 2024-06-11 16:43:37 发布

zealscott

最新推荐文章于 2024-06-11 16:43:37 发布

阅读量5.9k

点赞数

分类专栏：神经网络 MachineLearning 文章标签： softmax 对数似然交叉熵

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/crazy_scott/article/details/80303602

版权

介绍改进神经网络的基本方法：交叉熵代价函数与softmax。

二次代价函数

之前我们一直使用二次代价函数，貌似在一定程度上也挺work。但其实，当输入值与目标值差距很大时，二次代价函数就不是很恰当了；这是因为当差距很大时，此函数的学习速率会很慢。我们可以通过一个简单的例子观察这种变化：

假设我们只使用一个神经元与一个输出神经元，定义代价函数为：

C = ( y - a ) 2 2

$C = \frac{(y-a)^2}{2}$

使用链式法则计算权重和偏置的导数：

\partial C \partial w = (a - y) σ' (z) x

$\frac{\partial C}{\partial w}= (a-y)\sigma'(z)x$

\partial C \partial b = (a - y) σ' (z)

$\frac{\partial C}{\partial b} = (a-y)\sigma'(z)$

假设我们训练输入为 $x = 1$ ，目标输出为 $y = 0$ ，可以看见此时输入输出差距很大，则带入：

\partial C \partial w = a σ' (z)

$\frac{\partial C}{\partial w}= a\sigma'(z)$

\partial C \partial b = a σ' (z)

$\frac{\partial C}{\partial b} = a\sigma'(z)$

回忆一下 $\sigma$ 函数：

1526177496672

可以看出，当神经元的输出接近于1时，曲线变得相当平缓，因此 $\sigma'(z)$ 就很小了。这就是学习缓慢的原因。

交叉熵代价函数

因此，我们引入交叉熵代价函数，我们希望这个函数能弥补我们之前遇到的问题：

C = - 1 n \sum x [y ln a + (1 - y) ln (1 - a)]

$C = -\frac{1}{n}\sum\limits _x [y\ln a+(1-y)\ln (1-a)]$

这个函数的表达式看起来十分晦涩难懂，首先我们来看它为什么能成为一个代价函数。

why cost function

$C > 0$

代价函数需要满足非负性。

在求和中，由于 $y、a\in [0,1]$ ，因此都是负数，在前面加上一个负号就变为正数。
在神经元输出接近目标值时，代价函数接近于0

我们假设 $y = 0 , a \approx 0$ ，则带入可发现 $C\approx 0$

同样，在 $y = 1,a \approx 1$ ，也发现 $C \approx 0$

因此，满足这个性质。

交叉熵是非负的，并且在神经元达到很好的正确率时会接近于0，这就是我们想要的代价函数的性质。

why works

接下来我们就要来搞清楚为什么交叉熵代价函数能比二次代价函数更好地避免学习速率下降的问题：

我们对其求权重 $w$ 的偏导数：

\partial C \partial w j = = = - 1 n \sum x [y σ ( z ) - ( 1 - y ) 1 - σ ( z )] d σ ( z ) d z \partial z \partial w j - 1 n \sum x [y σ ( z ) - ( 1 - y ) 1 - σ ( z )] σ' (z) x j 1 n \sum x σ ' ( z ) x j

最低0.47元/天解锁文章

关注

0
点赞
踩
15

收藏

觉得还不错? 一键收藏
4
评论
交叉熵与softmax

介绍改进神经网络的基本方法：交叉熵代价函数与softmax。二次代价函数之前我们一直使用二次代价函数，貌似在一定程度上也挺work。但其实，当输入值与目标值差距很大时，二次代价函数就不是很恰当了；这是因为当差距很大时，此函数的学习速率会很慢。我们可以通过一个简单的例子观察这种变化：假设我们只使用一个神经元与一个输出神经元，定义代价函数为：C=(y−a)22C=(y−a)...
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。