【损失函数系列】softmax loss损失函数详解

最新推荐文章于 2024-07-20 16:13:15 发布

若曦爹

最新推荐文章于 2024-07-20 16:13:15 发布

阅读量4.1w

点赞数 46

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gbz3300255/article/details/108470972

版权

机器学习专栏收录该内容

42 篇文章 16 订阅

订阅专栏

1.损失函数：

损失函数（loss function）是用来评测模型的预测值f(x)与真实值Y的相似程度，损失函数越小，就代表模型的鲁棒性越好，损失函数指导模型学习。根据损失函数来做反向传播修改模型参数。机器学习的目的就是学习一组参数，使得预测值与真值无限接近。

2.softmax loss：

它是损失函数的一种，是softmax和cross-entropy loss组合而成的损失函数。

先看softmax，其函数形式如下：其中z就是某个神经网络全连接层输出的一组结果，例如分类问题，做4分类，z就是一个1*4的向量。j就是0~3下标号。zk就是全连接层第k个值。

（1）

全连接输出向量z的每个值没有大小限制，显然通过（1）后就强制将它给限制在0~1之间了，变成概率值。

cross-entropy loss 交叉熵损失函数在我的博客详细写了下：https://blog.csdn.net/gbz3300255/article/details/106810047。

这里就直接上交叉熵的公式了：

（2）

f(zc)就是上面的f(fzk),就是 softmax函数的输出值。yc就是样本真值喽。公式（2）就是最终的损失函数值了。

举例说明：例如真实样本标签为

yc = [0, 0, 1, 0]。

而第一个预测结果为

f（z1） = [0.1, 0.1, 0.7, 0.1]

f（z2） = [0.25, 0.2, 0.3, 0.35]

f（z3） = [0.15, 0.2, 0.1, 0.55]

显然第一个预测结果是对的，第二个，第三个都是错的。他们的损失函数值分别为

Lz1 = -log0.7

Lz2 = -log0.3

Lz3 = -log0.1

L函数图像如下：

显然，与真值越接近，损失函数越小，与真值相去越远，损失函数越大。优化过程就是不断的将与真值接近的那个概率值提升，提升，再提升，让损失函数降低，降低，再降低。

关注

46
点赞
踩
155

收藏

觉得还不错? 一键收藏
7
评论
【损失函数系列】softmax loss损失函数详解

1.损失函数：损失函数（loss function）是用来评测模型的预测值f(x)与真实值Y的相似程度，损失函数越小，就代表模型的鲁棒性越好，损失函数指导模型学习。根据损失函数来做反向传播修改模型参数。机器学习的目的就是学习一组参数，使得预测值与真值无限接近。2.softmax loss：它是损失函数的一种，是softmax和cross-entropy loss组合而成的损失函数。先看softmax，其函数形式如下：其中zj就是某个神经网络全连...
复制链接

扫一扫

专栏目录

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。