【深度学习】回归问题和分类问题损失函数求导

最新推荐文章于 2024-06-09 08:14:39 发布

泉水豆花儿

最新推荐文章于 2024-06-09 08:14:39 发布

阅读量518

点赞数 1

分类专栏：深度学习

本文链接：https://blog.csdn.net/zc_stats/article/details/103848991

版权

深度学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1.回归问题

在这里插入图片描述
$\frac{1}{2N}\sum_{i=1}^{N} \|y^i - \hat{y} \|^2$
$\frac{ \partial J}{\partial y^i} = \frac{1}{N}\sum_{i=1}^{N}{(y^i - \hat{y})}$

2.分类问题

在这里插入图片描述
先对y进行softmax：
$S_k = \frac{e^{y_{k}}}{\sum_{i=1}^{n}{e^{y_i}}}$
以单个样本为例，网络输出的 $\hat{S} (s_1,s_2,...,s_n)$ 为一个概率分布，n是类别个数；该样本的实际标签一般one-hot形式， $S (0, 0, . . ., 1, 0, 0, . . 0)$ 可以看做是（硬）概率分布。
可以考虑KL散度来计算损失。其实，直接根据交叉熵就可以写出损失函数：
这里只考虑单个样本，方便简化运算。
$\sum_{k=1}^{n}{Slog\hat{S}} \\ = - log (s_k) =-log(\frac{e^{y_{k}}}{\sum_{i=0}^{n-1}{e^{y_i}}})$
对 $y_k$ 求导:
$\frac{ \partial J}{\partial y_k} = \frac{\partial }{\partial y_k}\{{log (\sum_{i=0}^{n-1}e^{y_i}}) - y_k \} = \frac{e^{y_{k}}}{\sum_{i=0}^{n-1}{e^{y_i}}} - 1$
即可以写成 :
$\frac{ \partial J}{\partial y_k} = s_k - \delta(i=k) ， \\ \delta =1,当i=k时，\delta=0, 当i!=k时$
最终写成向量的形式（单个样本形式）:
$\frac{ \partial J}{\partial y} = \hat{S}-S$

泉水豆花儿

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【深度学习】回归问题和分类问题损失函数求导

1.回归问题J=12N∑i=1N∥yi−y^∥2 J = \frac{1}{2N}\sum_{i=1}^{N} \|y^i - \hat{y} \|^2 J=2N1i=1∑N∥yi−y^∥2∂J∂yi=1N∑i=1N(yi−y^) \frac{ \partial J}{\partial y^i} = \frac{1}{N}\sum_{i=1}^{N}{(y^i - \hat{y})} ...
复制链接

扫一扫