nn.BCELoss和nn.CrossEntropyloss 总结

最新推荐文章于 2024-06-18 18:30:34 发布

今天你码了吗

最新推荐文章于 2024-06-18 18:30:34 发布

阅读量1.8k

点赞数 1

分类专栏：损失函数文章标签：深度学习 python 神经网络机器学习人工智能

本文链接：https://blog.csdn.net/weixin_50249353/article/details/119239907

版权

损失函数专栏收录该内容

1 篇文章 0 订阅

订阅专栏

nn.BCELoss和nn.CrossEntropyloss总结

参考博文如下

在参考了这些博文后，终于对损失函数有了一些了解现在总结起来方便以后复习
链接1: softmax
链接:2
链接：3
链接：4

如有侵权立马删除

nn.BCEloss

公式如下：
1. **全新的界面设计** ，将会带来全新的写作体验；
1.输入的X 代表模型的最后输出 y 代表你的label 我们的目的就是为了让模型去更好的学习label 所以loss 越小的话 x越接近label 我们的学习效果也越好
2. 使用这个公式前 x需要先通过sigmoid 激活函数归一化到0-1之间
3. 一般二分类都是用的nn.BCELoss 因为二分类只有0 1 之分正样本是1 负样本是0 看这个公式当是正样本的时候公式为 -w(ylogx) 不看w 的话 Loss的值域应该是 0到正无穷所以loss最小是0 也就是x为1的时候所以 x越大loss越小也就是x越接近正样本1 loss越小这就是这个公式的意义反之一样
4. 使用BCELoss input和target shape 是一样的 nn.CrossEntropyloss和这个不同

nn.CrossEntropyloss

公式如：
在这里插入图片描述
logsoftmax 公式：

nll loss 公式：

这个公式简单来说就是 logsoftmax+ nllloss的结合体，不明白的先看我参考的那几篇博文

log里面实际上就是softmax 公式所以输入不需要像BECLoss 一样先经过激活函数这里面自带激活函数
加上log 就是 logsoftmax 了
再取负数就是nllloss的概念了这里nllloss里面有参数 mean 和 sum 实际上就是对应的nn.CrossEntropyloss 里面的reduction参数 mean代表取均值 sum代表取总和
input和target 的shape 不一样 input 是N*C C代表种类个数 target 是N
这里的原因就是上面的nllloss的缘故他的作用是把对应标签位置的值拿出来取负数

举个例子

比如输入是3*3 代表 3张图片预测3类每一张图片都预测他属于每一类的概率
因为经过了softmax所以概率和为1 我们假设是
[[0.2,0.3,0.5],
[0.8,0.1,0.1],
[0.7,0.2,0.1] 可以看出来每一行的和为1 行代表图片个数列代表种类而我们的标签是3 和输入不对应
比如是[0,1,2] 这时候会自动one-hot编码比如0 会变成[1,0,0]他会吧每一行对应的标签的数拿出来第一个0 应该是第0类所以吧0.8拿出来第二个是1 吧0.1拿出来以此类推。这样就拿出来了3个数根据reduction的设置取平均或者总和代表了最后的损失可以看出只有loss越小说明标签是对应的学习的越好。

总结

总结一下nn.CrossEntropyloss
看整个公式实际就是交叉熵公式在这里插入图片描述

今天你码了吗

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
nn.BCELoss和nn.CrossEntropyloss 总结

nn.BCELoss和nn.CrossEntropyloss总结参考博文如下nn.BCElossnn.CrossEntropyloss总结参考博文如下在参考了这些博文后，终于对损失函数有了一些了解现在总结起来方便以后复习链接1: softmax链接:2链接：3链接：4如有侵权立马删除nn.BCEloss公式如下：1.输入的X 代表模型的最后输出 y 代表你的label 我们的目的就是为了让模型去更好的学习label 所以loss 越小的话 x越接近label 我们的学习效
复制链接

扫一扫