从交叉熵（CrossEntropy）到交叉熵损失函数（CrossEntropy Loss）

最新推荐文章于 2023-11-05 20:57:24 发布

isunLt

最新推荐文章于 2023-11-05 20:57:24 发布

阅读量313

点赞数

分类专栏：基础知识文章标签：深度学习神经网络

本文链接：https://blog.csdn.net/isunLt/article/details/108887640

版权

基础知识专栏收录该内容

7 篇文章 0 订阅

订阅专栏

所谓交叉熵，这篇文章《什么是交叉熵》讲的很明白。设X是预测分布，Y是真实分布，交叉熵H(X, Y)的表达式为：
$H(X,Y)=-\sum_i Y[i]\log X[i]$

其中 $l o g$ 表示自然对数，以 $e$ 为底数，不是10为底数。
再看到Pytorch Document中对交叉熵损失函数的描述为：
$class)=-\log (\frac{exp(X[class])}{\sum_j exp(X[j])})$

那么交叉熵 $H (X, Y)$ 是怎么到交叉熵损失函数 $l o s s (X, c l a s s)$ 的呢?
首先，一般网络的流程是，将神经网络的输出值X输入 $S o f t m a x$ 后再输入交叉熵损失函数， $S o f t m a x$ 的表达式如下：
$Softmax(X,i)=\frac{exp(X[i])}{\sum_j exp(X[j])}$

用以训练的标签通常是在正确的那一类标1，其他错误的类全标0，交叉熵损失函数 $l o s s (X, c l a s s)$ 中的 $c l a s s$ 即表示这个样本的正确分类，也就是 $H (X, Y)$ 中的真实分布 $Y$ ，即 $Y_{i=class}=1,Y_{i\neq class}=0$ ，所以有
$H(X,Y)=-\sum_i Y[i]\log X[i] =-\log X[class]$

又有 $X_{class}=Softmax(X,class)$ ，所以
$H(X,Y)=-\log X[class]=-\log Softmax(X,class)=-\log (\frac{exp(X[class])}{\sum_j exp(X[j])}) = loss(X,class)$

isunLt

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
从交叉熵（CrossEntropy）到交叉熵损失函数（CrossEntropy Loss）

从交叉熵（CrossEntropy）到交叉熵损失函数（CrossEntropy Loss）所谓交叉熵，这篇文章《什么是交叉熵》讲的很明白。设X是预测分布，Y是真实分布，交叉熵H(X, Y)的表达式为：H(X,Y)=−∑iY[i]log⁡X[i] H(X,Y)=-\sum_i Y[i]\log X[i] H(X,Y)=−i∑Y[i]logX[i]其中logloglog表示自然对数，以eee为底数，不是10为底数。再看到Pytorch Document中对交叉熵损失函数的描述为：loss(X,cla
复制链接

扫一扫

专栏目录