多分类问题为什么用softmax函数和交叉熵损失

科学禅道

于 2023-08-20 11:15:39 发布

阅读量323

点赞数

文章标签：人工智能机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-NC-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xw555666/article/details/132389858

版权

本文介绍了损失函数在评估预测效果中的作用，重点讲解了交叉熵损失如何衡量预测概率与真实概率间的差异，以及softmax函数在生成概率分布的应用。多分类问题通过softmax和交叉熵结合，转化为概率分布拟合问题，通过梯度更新优化参数以减小损失函数。

摘要由CSDN通过智能技术生成

1、损失函数是用来度量预测的效果：

这句话的意思是，预测效果好不好，我们需要用一个函数来度量，或者更直接一点，需要一个数来表示一下，例如0.9比0.8要好，而损失函数就是计算得到0.9还是0.8的函数。

2、交叉熵损失通过量化预测概率与真实概率分布之间的差异：

直白一些，就是有一个事真实概率分布是某个，我们又可以计算得出某个预测概率，计算这两个之间的距离的一种方式就是交叉熵H（P，Q），就是两个概率分布之间的距离的一种计算方式

3、softmax函数通常用于将一个向量（或一组实数）映射为一个概率分布

4、那么多分类问题的解决逻辑是，给每个类别都计算一个数，这样就得到了所有类别的一组数，用softmax将这组数映射为一个概率分布（被认为是预测的概率分布），然后用交叉熵来计算这个预测的概率分布与真实概率分布（用标签来表示）之间的距离，根据这个距离的反馈来计算梯度，更新参数，以使得这个距离变短，也就是损失函数变小，当损失函数很小时，我们认为这个任务被解决的比较好！

5、所以，多分类问题被变成了一个概率分布函数拟合问题！度量拟合效果的就是交叉熵损失，当然，也可以用其他的损失函数。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
多分类问题为什么用softmax函数和交叉熵损失

是，给每个类别都计算一个数，这样就得到了所有类别的一组数，用softmax将这组数映射为一个概率分布（被认为是预测的概率分布），然后用交叉熵来计算这个预测的概率分布与真实概率分布（用标签来表示）之间的距离，根据这个距离的反馈来计算梯度，更新参数，以使得这个距离变短，也就是损失函数变小，当损失函数很小时，我们认为这个任务被解决的比较好！直白一些，就是有一个事真实概率分布是某个，我们又可以计算得出某个预测概率，计算这两个之间的距离的一种方式就是交叉熵H（P，Q），就是两个概率分布之间的距离的一种计算方式。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。