交叉熵损失函数

最新推荐文章于 2024-05-13 20:32:49 发布

维他柠檬可乐

最新推荐文章于 2024-05-13 20:32:49 发布

阅读量2.3w

点赞数 9

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_31244453/article/details/112297848

版权

深度学习专栏收录该内容

26 篇文章 3 订阅

订阅专栏

目录

1交叉熵损失函数（Cross Entropy loss）：

1.1交叉熵损失函数公式：

1.2交叉熵损失函数推导过程：

1.3 交叉熵损失函数的特殊值

1交叉熵损失函数（Cross Entropy loss）：

1.1交叉熵损失函数公式：

y是真实的标签值(正类值为1，负类值为0)，y`是预测的概率值（y·∈(0,1)）.它表征真实样本标签和预测概率之间的差值.

1.2交叉熵损失函数推导过程：

举个二分类例子，要么有打球，要么没有打球.假设打球的标签值为1，没打球的标签值为0：

假如甲喜欢打篮球，他天天打篮球，建立一个预测模型。预测模型预测他今天打篮球的概率为0.8，实际上他今天打篮球了。那么真实值就是1.那么他的交叉熵损失函数值就是0.22.

计算公式为：loss1 = -[1*ln0.8+(1-1)*ln(1-0.8)] = 0.22

假如乙也喜欢打篮球，预测模型预测他今天打篮球的概率是0.7，实际上他今天没有打球。那么真实值就是0，那么他的交叉熵损失函数值就是1.2.

计算公式为：loss2 = -[0*ln0.7+(1-0)*ln0.3)] = 1.2

总结：损失值函数更小，反向传播的力度也就更小。损失值函数更大，反向传播的力度也就更大.

1.3 交叉熵损失函数的特殊值

我们从图像的角度，分析交叉熵函数。

首先，写出单个样本的交叉熵损失函数：

我们知道，当y=1时；

L= -logy`

这时候，L与预测输出的关系如下图所示：

看了L的图形，横坐标是预测输出，纵坐标是交叉熵损失函数L.显然，预测输出越接近真实样本标签 1，损失函数 L 越小；预测输出越接近 0，L 越大。因此，函数的变化趋势完全符合实际需要的情况。

当y=0时：

L= -log(1-y')

这时候，L与预测输出的关系如下图所示：

同样，预测输出越接近真实样本标签 0，损失函数 L 越小；预测函数越接近 1，L 越大。函数的变化趋势也完全符合实际需要的情况。

从上面两种图，可以帮助我们对交叉熵损失函数有更直观的理解。无论真实样本标签 y 是 0 还是 1，L 都表征了预测输出与 y 的差距。

另外，重点提一点的是，从图形中我们可以发现：预测输出与 y 差得越多，L 的值越大，也就是说对当前模型的 “ 惩罚 ” 越大，而且是非线性增大，

是一种类似指数增长的级别。这是由 log 函数本身的特性所决定的。这样的好处是模型会倾向于让预测输出更接近真实样本标签 y。

总结：交叉熵函数是针对二分类问题比较实用，在预测模型里面，交叉熵函数越小，说明预测准确度越高，相反，则预测准确度越低。

下一步需要了解均方误差损失函数.

参考：

1.https://juejin.cn/post/6844903622233292813

维他柠檬可乐

关注

9
点赞
踩
38

收藏

觉得还不错? 一键收藏
0
评论
交叉熵损失函数

目录1交叉熵损失函数（Cross Entropy loss）：1.1交叉熵损失函数公式：1.2交叉熵损失函数推导过程：1.3 交叉熵损失函数的特殊值1交叉熵损失函数（Cross Entropy loss）：1.1交叉熵损失函数公式：y是真实的标签值(正类值为1，负类值为0)，y`是预测的概率值（y·∈(0,1)）.它表征真实样本标签和预测概率之间的差值.1.2交叉熵损失函数推导过程：举个二分类例子，要么有打球，要么没有打球.假设打球的标签值为1，没打球的标签.
复制链接

扫一扫

专栏目录

维他柠檬可乐 CSDN认证博客专家 CSDN认证企业博客

码龄9年

84: 原创

30万+: 周排名

2万+: 总排名

19万+: 访问

: 等级

1333: 积分

104: 粉丝

196: 获赞

23: 评论

909: 收藏

私信

关注

热门文章

分类专栏

最新评论

ABB工业机器人程序编写与实战
西木九: 是rapid和c#很像嘛？
读取和归一化CIFAR10
一个喜欢吃草莓味奶糖的女孩: cifar10数据集的normalize是这个嘛？transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)
ABB工业机器人程序编写与实战
糊涂白豆: 你好，我想咨询下工作站的夹爪模型和控制设计能否共享下呢？可以商量
Pytorch-detach()用法
栏杆拍遍看吴钩: 同意，应该不是一个内存，detach本身也有分离的意思，如果指向一个内存，应该有reshape的意思而不是分离的意思，这里detach应该是从计算图中分离，大概相当于从函数中输出一个张量，输出之后的张量自然与函数的后续计算无关了。
super(Net, self).__init__()
qq_43130158: 先print(self.x)

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。