分类问题中，常选择交叉熵损失函数而不是MSE损失函数

最新推荐文章于 2023-11-12 23:31:05 发布

tianyunzqs

最新推荐文章于 2023-11-12 23:31:05 发布

阅读量989

点赞数 2

分类专栏： DeepLearning 文章标签：损失函数

本文链接：https://blog.csdn.net/tianyunzqs/article/details/92628064

版权

DeepLearning 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

均方误差(Mean Square Error, MSE)损失函数：

$L=\frac{1}{2N}\sum_{i=i}^{N}{(y-\widehat{y})}^2 \ \ \ \ \ \ \ \ \ \ \ (1)$

对求偏导（对求导类似）：

$\begin{align*} {\frac{\partial L}{\partial w}} &= -\frac{1}{N}\sum_{i=1}^{N}(y-\widehat{y})\cdot \frac{\partial \widehat{y}}{\partial w} \ \ \ \ \ \ \ \ \ (2) \end{align*}$

交叉熵损失函数：

$L=-\frac{1}{N}\sum_{i=1}^{N}[ylog\widehat{y} + (1-y)log(1-\widehat{y})]\ \ \ \ \ (3)$

对求偏导（对求导类似）：

$\begin{align*} {\frac{\partial L}{\partial w}} &= -\frac{1}{N}\sum_{i=1}^{N}[y\cdot \frac{1}{\widehat{y}}\cdot \frac{\partial \widehat{y}}{\partial x}+(1-y)\cdot \frac{-1}{1-\widehat{y}}\cdot \frac{\partial \widehat{y}}{\partial x}]\\ &= -\frac{1}{N}\sum_{i=1}^{N}[\frac{y-\widehat{y}}{\widehat{y}\cdot (1-\widehat{y})}\cdot \frac{\partial \widehat{y}}{\partial w}]\\ &=-\frac{1}{N}\sum_{i=1}^{N}[(y-\widehat{y})\cdot x_{_{i}}] \ \ \ \ \ \ \ \ (4) \end{align*}$