使用cross-entropy （交叉熵）定义loss的概率意义

FibonacciCode

已于 2023-01-10 13:29:18 修改

阅读量458

点赞数

分类专栏：深度学习算法文章标签：人工智能算法

于 2023-01-10 09:53:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yuebowhu/article/details/128624690

版权

文章讨论了在多分类问题中，如何使用交叉熵损失函数来符合概率的定义。通过softmax函数，可以得到一个概率分布，表示每个类别的条件概率。最大似然估计则要求我们最大化样本出现的概率，这等价于最小化负对数似然。损失函数定义为每个样本的真实标签与模型预测之间的交叉熵。通过计算，证明了这种定义符合概率的归一化条件，即所有类别的概率之和为1。

摘要由CSDN通过智能技术生成

证明：在多分类问题中，交叉熵损失（cross-entropy loss）定义loss是符合概率的。
证明：
极大似然的表述如下：
softmax函数给出了一个向量 $\hat{\mathbf{y}}$ ，它是一个概率分布，满足 $\sum_1^q \hat{y_j}^{(i)} = 1$ ，我们可以将其视为“对给定任意输入的每个类的条件概率”。例如 $P(y=\text{猫} \mid \mathbf{x})$ 。假设整个数据集 $\{\mathbf{X}, \mathbf{Y}\}$ 具有 $n$ 个样本，其中索引 $i$ 的样本由特征向量 $\mathbf{x}^{(i)}$ 和独热标签向量 $\mathbf{y}^{(i)}$ 组成。
上述样本出现的概率：
$P(\mathbf{Y} \mid \mathbf{X}) = \prod_{i=1}^n P(\mathbf{y}^{(i)} \mid \mathbf{x}^{(i)}).$

根据最大似然估计，我们最大化 $P(\mathbf{Y} \mid \mathbf{X})$ ，相当于最小化负对数似然：

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用cross-entropy （交叉熵）定义loss的概率意义

使用cross-entropy loss（交叉熵）定义loss的概率意义
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。