二次代价函数和softmax交叉熵损失函数原理及分析

最新推荐文章于 2024-05-13 20:32:49 发布

生命长跑

最新推荐文章于 2024-05-13 20:32:49 发布

阅读量1k

点赞数

分类专栏：深度学习理论文章标签： softmax 交叉熵损失函数二次代价函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30683995/article/details/100074782

版权

深度学习理论专栏收录该内容

5 篇文章 0 订阅

订阅专栏

首先看一下二次代价函数：

以二分类问题，常见的sigmoid激活函数为例，假设表示输入值，表示真实标签（0或1），表示预测输出，则二次代价函数可表示为：

$C=\frac{(y-a)^2}{2}$

其中 $a=\sigma (z)=\sigma (wx+b)=\frac{1}{1-e^{-x}}$

那么代价函数对权重和偏置的偏导数分别为：

$\frac{\partial C}{\partial w}=(\sigma (z)-y)\cdot \sigma '(z)\cdot x$

$\frac{\partial C}{\partial b}=(\sigma (z)-y)\cdot \sigma '(z)$

从上式可以分析：当代价较大即输入输出差别较大时， $\sigma (z)$ 的值趋于0或1，此时 $\sigma '(z)$ 的值趋于0，既权重和偏置的梯度趋于0。这与我们所期望的当代价较大即输入输出差别较大时，以较大的梯度下降更新权重和偏置相违背。

再看交叉熵损失函数：

同样以二分类问题为例，损失函数为：

C=-(yln(a)+(1-y)ln(1-a))

简单分析一下：当为1时，上式变为： C=-ln(a) ，当预测结果越接近真实标签时损失越小。当为0时，上式变为： C=-ln(1-a) ，当预测结果越接近真实标签时同样损失越小。这么看来交叉熵函数具有作为损失函数的性质。

接下来先推导一下交叉熵损失函数是怎么来的，再从导数角度分析其作为损失函数的可行性：

首先sigmoid函数的输出可以表征预测标签的概率，假设预测标签为1的概率表示为 a=P(y=1|x) ，那么预测标签为0的概率则为 1-a=P(y=0|x) 。根据最大似然估计，有：

$P(y|x)=a^y\cdot (1-a)^{(1-y)}$

我们希望 P(y|x) 最大，对其取对数，再取负数，有：

C=-ln(P(y|x))=-(yln(a)+(1-y)ln(1-a))

即变成最小化的问题，这便是交叉熵损失函数推导过程。

再看交叉熵损失函数对权重和偏置的偏导数，分别为：

$\frac{\partial C}{\partial w}=-\left [ \frac{y}{\sigma (z)}\cdot \sigma '(z)-\frac{1-y}{1-a}\cdot \sigma '(z)]\cdot \frac{\partial z}{\partial w}\right ]=\left [ \frac{\sigma (z)-y}{\sigma (z)\left ( 1-\sigma (z) \right )}\cdot \sigma '(z) \right ]\cdot x$

将 $\sigma '(z)=\sigma (z)\left ( 1-\sigma (z) \right )$ 带入上式，得：

$\frac{\partial C}{\partial w}=x\left [ \sigma (z)-y \right ]$

同理得： $\frac{\partial C}{\partial b}=\sigma (z)-y$

从上式可以分析：当代价较大即输入输出差别较大时，权重和偏置的梯度越大。这与我们所期望的当代价较大时以较大的梯度下降更新权重和偏置相符。因此，相比二次代价函数交叉熵损失函数更好。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
二次代价函数和softmax交叉熵损失函数原理及分析

首先看一下二次代价函数：以二分类问题，常见的sigmoid激活函数为例，假设表示输入值，表示真实标签（0或1），表示预测输出，则二次代价函数可表示为：其中那么代价函数对权重和偏置的偏导数分别为：从上式可以分析：当代价较大即输入输出差别较大时，的值趋于0或1，此时的值趋于0，既权重和偏置的梯度趋于0。这与我们所期望的当代价较大即输入输出差别较大时，以较大的梯度下降更新权重...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。