Pytorch 教程 3-损失函数

最新推荐文章于 2024-07-19 16:12:05 发布

Goduser0

最新推荐文章于 2024-07-19 16:12:05 发布

阅读量32

点赞数

分类专栏： Pytorch教程文章标签： pytorch 人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42845086/article/details/134489454

版权

Pytorch教程专栏收录该内容

5 篇文章 0 订阅

订阅专栏

三、损失函数Loss

3.1 L1Loss

torch.nn.L1Loss(size_average=True, reduce=True)
- 计算output和target之差的绝对值，可选返回同维度的tensor或者是一个标量
- 计算公式
  
  $\operatorname{loss}(\mathbf{x},\mathbf{y})=\dfrac{1}{N}\sum_{i=1}^{N}|\mathbf{x}-\mathbf{y}|$
- 参数
  - size_average(bool)：当reduce=True有效时，为True，返回的loss为平均值；为False，返回的各样本的loss之和
  - reduce(bool)：返回值是否为标量，默认为True

3.2 MSELoss

torch.nn.MSELoss(size_average=None, reduce=None)
- 计算output和target之差的平方，可选返回同维度的tensor或者是一个标量
- 计算公式
  
  $\operatorname{loss}(\mathbf x,\mathbf y)=\dfrac1N\sum_{i=1}^N\left|\mathbf x-\mathbf y\right|^2$
- 参数
  - size_average(bool)：当reduce=True有效时，为True，返回的loss为平均值；为False，返回的各样本的loss之和
  - reduce(bool)：返回值是否为标量，默认为True

3.3 CrossEntropyLoss

torch.nn.CrossEntropyLoss(weight=None, size_average=None, ignore_index=None, reduce=None, reduction='elementwise_mean')
- 将输入经过softmax激活函数之后，再计算其与target的交叉熵损失。即该方法将nn.LogSoftmax()和nn.NLLLoss()进行了结合。严格意义上的交叉熵损失函数应该是nn.NLLLoss()
- 计算公式
  
  $\operatorname{loss}(x,class)=-\log\left(\dfrac{\exp(x[class])}{\sum_{j}\exp(x[j])}\right)=-x[class]+\log\left(\sum_{j}\exp(x[j])\right)$
- 参数
  - weight(Tensor)：为每个类别的loss设置权值，常用于类别不均衡问题，weight必须是float类型的tensor
  - size_average(bool)：当reduce=True有效时，为True，返回的loss为平均值；为False，返回的各样本的loss之和
  - reduce(bool)：返回值是否为标量，默认为True
  - ignore_index(int)：忽略某一类别，不计算其loss，其loss为0，并且，在采用size_average时，不会计算那一类的 loss，除的时候的分母也不会统计那一类的样本。

3.4 NLLLoss

torch.nn.NLLLoss(weight=None, size_average=None, ignore_index=None, reduce=None, reduction='elementwise_mean')
- 计算公式
  
  $\operatorname{loss}(\mathbf{x},\mathrm{label})=-\mathbf{x}_{\mathrm{label}}$
- 参数
  - weight(Tensor)：为每个类别的loss设置权值，常用于类别不均衡问题，weight必须是float类型的tensor
  - size_average(bool)：当reduce=True有效时，为True，返回的loss为平均值；为False，返回的各样本的loss之和
  - reduce(bool)：返回值是否为标量，默认为True
  - ignore_index(int)：忽略某一类别，不计算其loss，其loss为0，并且，在采用size_average时，不会计算那一类的 loss，除的时候的分母也不会统计那一类的样本。

3.5 PoissonNLLLoss

torch.nn.PoissonNLLLoss(log_input=True, full=False, size_average=None, eps=1e-8, reduce=None, reduction='elementwise_mean')
- 用于target服从泊松公布的分类任务
- 计算公式
  
  $target\sim Possion(input)\\ loss(input,target) = input - target*ln(input)+ln(target!)$
- 参数
  - log_input(bool)：为True时候，计算公式为： $l oss (in p u t, t a r g e t) = e x p (in p u t) - t a r g e t * in p u t$ ，为False时， $l oss (in p u t, t a r g e t) = in p u t - t a r g e t * l o g (in p u t + e p s)$
  - full(bool)：是否计算全部的los
  - eps(float)：当log_input=False时，用来防止计算log(0)，而增加的一个修正项
  - size_average(bool)：当reduce=True有效时，为True，返回的loss为平均值；为False，返回的各样本的loss之和
  - reduce(bool)：返回值是否为标量，默认为True

3.6 KLDivLose

torch.nn.KLDivLoss(size_average=None, reduce=None, reduction='elementwise_mean')
- 计算input和target之间的KL散度
- 参数
  - size_average(bool)：当reduce=True有效时，为True，返回的loss为平均值，平均值为element-wise的，而不是针对样本的平均；为False，返回的各样本的loss之和
  - reduce(bool)：返回值是否为标量，默认为True

3.7 BCELoss

torch.nn.BCELoss(weight=None, size_average=None, reduce=None, reduce=None, reduction='elementwise_mean')
- 二分类任务时的交叉熵计算函数。在自编码器中常用
- 计算公式
  
  $\ell(x,y)=L=\{l_1,\dots,l_N\}^\top,l_n=-w_n\left[y_n\cdot\log x_n+(1-y_n)\cdot\log(1-x_n)\right]$
- 参数
  - weight(Tensor)：为每个类别的loss设置权值，常用于类别不均衡问题，weight必须是float类型的tensor
  - size_average(bool)：当reduce=True有效时，为True，返回的loss为平均值；为False，返回的各样本的loss之和
  - reduce(bool)：返回值是否为标量，默认为True

3.8 BCEWithLogitsLoss

torch.nn.BCEWithLogitsLoss(weight=None, size_average=None, reduce=None, reduction='elementwise_mean', pos_weight=None)
- 将Sigmoid和BCELoss结合，input经过Sigmoid激活函数后，将变成概率分布的形式
- 计算公式
  
  $\ell(x,y)=L=\{l_1,\ldots,l_N\}^{\text{T}},\quad l_n=-w_n\left[t_n\cdot\log\sigma(x_n)+(1-t_n)\cdot\log(1-\sigma(x_n))\right]\\ \sigma()表示Sigmoid函数$
- 参数
  - weight(Tensor)：为batch中单个样本设置权值
  - pos_weight：正样本的权重，当 $p > 1$ ，提高召回率，当 $p < 1$ ，提高精确度，可达到权衡召回率和精确度的作用，必须为一个与类别数等长的向量
  - size_average(bool)：当reduce=True有效时，为True，返回的loss为平均值；为False，返回的各样本的loss之和
  - reduce(bool)：返回值是否为标量，默认为True

3.9 MarginRankingLoss

torch.nn.MarginRankingLoss(margin=0, size_average=None, reduce=None, reduction='elementwise_mean')
- 计算两个向量之间的相似度，当两个向量之间的距离大于margin，则loss为正，小于margin，loss为0
- 计算公式
  
  $loss(x,y)=max(0,-y*(x_1-x_2)+margin)$
- 参数
  - maegin(float)： $x_1$ 和 $x_2$ 之间的差异
  - size_average(bool)：当reduce=True有效时，为True，返回的loss为平均值；为False，返回的各样本的loss之和
  - reduce(bool)：返回值是否为标量，默认为True

3.10 HingeEmbeddingLoss

torch.nn.HingeEmbeddingLoss(margin=1.0, size_average=None, reduce=None, reduction='elementwise_mean')
- 为折页损失的拓展，主要用于衡量两个输入是否相似
- 计算公式
  
  $l_n=\left\{\begin{array}{ll}x_n,&\textrm{if}y_n=1,\\ \max\{0,\Delta-x_n\},&\textrm{if}{y_n=-1},\end{array}\right.$
- 参数
  - maegin(float)：默认为1，容忍的差距
  - size_average(bool)：当reduce=True有效时，为True，返回的loss为平均值；为False，返回的各样本的loss之和
  - reduce(bool)：返回值是否为标量，默认为True

3.11 MultiLabelMarginLoss

torch.nn.MultiLabelMarginLoss(size_average=None, reduce=None, reduction='elementwise_mean')
- 用于一个样本属于多个类别时的分类任务

3.12 SmoothL1Loss

torch.nn.SmoothL1Loss(size_average=None, reduce=None, reduction='elementwise_mean')
- 计算平滑L1损失
- 计算公式
  
  $\quad loss(x,y)=\dfrac{1}{n}\sum_i z_i\\\text{where }z_i\text{ is given}\text{ by:}\\ \quad z_i=\left\{\begin{array}{ll}0.5(x_i-y_i)^2,&\text{if }|x_i-y_i|<1\\ |x_i-y_j|-0.5,&\text{otherwise}\end{array}\right.$
- 参数
  - size_average(bool)：当reduce=True有效时，为True，返回的loss为平均值；为False，返回的各样本的loss之和
  - reduce(bool)：返回值是否为标量，默认为True

3.13 SoftMarginLoss

torch.nn.SoftMarginLoss(size_average=None, reduce=None, reduction='elementwise_mean')
- 参数
  - size_average(bool)：当reduce=True有效时，为True，返回的loss为平均值；为False，返回的各样本的loss之和
  - reduce(bool)：返回值是否为标量，默认为True

3.14 MultiLabelSoftMarginLoss

torch.nn.MultiLabelSoftMarginLoss(weight=None, size_average=None, reduce=None, reduction='elementwise_mean')
- SoftMarginLoss的多标签版本
- 参数
  - weight(Tensor)：为每个类别的loss设置权值，常用于类别不均衡问题，weight必须是float类型的tensor
  - size_average(bool)：当reduce=True有效时，为True，返回的loss为平均值；为False，返回的各样本的loss之和
  - reduce(bool)：返回值是否为标量，默认为True

3.15 CosineEmbeddingLoss

torch.nn.CosineEmbeddingLoss(margin=0, size_average=None, reduce=None, reduction='elementwise_mean')
- 用cosine函数来衡量两个输入是否相似
- 计算公式
  
  $\operatorname{loss}(x,y)=\left\{\begin{array}{ll}1-\cos(x_1,x_2),&\text{if }y==1\\ \operatorname*{max}(0,\cos(x_{1},x_2)-\operatorname{margin}),&\textrm{if }y==-1\end{array}\right.$
- 参数
  - margin(float)：取值范围 $[- 1, 1]$ ，推荐设置范围 $[0, 0.5]$
  - size_average(bool)：当reduce=True有效时，为True，返回的loss为平均值；为False，返回的各样本的loss之和
  - reduce(bool)：返回值是否为标量，默认为True

3.16 MultiMarginLoss

torch.nn.MultiMarginLoss(p=1, margin=1, weight=None, size_average=None, reduce=None, reduction='elementwise_mean')
- 计算多分类的折页损失

3.17 TripletMarginLoss

torch.nn.TripletMarginLoss(margin=1.0, p=2, eps=1e06, swap=False, size_average=None, reduce=None, eduction='elementwise_mean')
- 计算三元组损失，人脸验证中常用
- 计算公式
  
  $L(a,p,n)=\max\{d(a_i,p_i)-d(a_i,n_i)+margin,0\}\\ \text{where }d(x_i,y_i)=\|\mathbf{x}_i-\mathbf{y}_i\|_D.$
- 参数
  - margin(float)：默认值为 1
  - p(int)：The norm degree ，默认值为 2
  - size_average(bool)：当reduce=True有效时，为True，返回的loss为平均值；为False，返回的各样本的loss之和
  - reduce(bool)：返回值是否为标量，默认为True

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Pytorch 教程 3-损失函数

计算output和target之差的绝对值，可选返回同维度的tensor或者是一个标量计算公式lossxyN1i1∑N∣x−y∣参数。
复制链接

扫一扫

专栏目录

Goduser0 CSDN认证博客专家 CSDN认证企业博客

码龄6年

10: 原创

66万+: 周排名

26万+: 总排名

559: 访问

: 等级

102: 积分

1: 粉丝

0: 获赞

2: 评论

1: 收藏

私信

关注

热门文章

分类专栏

最新评论

C++ Primer 第一章开始
CSDN-Ada助手: 恭喜你开始博客创作！C++ Primer是一本非常经典的编程书籍，你选择了一个很好的主题来开始你的博客。第一章是非常重要的，它会给读者一个初步的认识，为后面的学习打下坚实的基础。接下来，我建议你可以从实际例子和个人经验出发，结合第一章的内容，分享一些你在学习C++ Primer过程中的思考和体会，这样能够更好地吸引读者，也让你的博客更具个人特色。祝愿你的博客创作蓬勃发展！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
C++ Primer 第二章变量和基本类型
CSDN-Ada助手: 这是一篇非常好的博文！非常感谢您的分享和努力。您对C++Primer第二章的解释非常清晰，让读者能够更好地理解变量和基本类型。除了您所提到的内容，我还想分享一些与该博文相关的扩展知识和技能。在C++中，还有一些其他的初始化方式，如值初始化和直接初始化。值初始化将变量初始化为默认值，而直接初始化则允许我们在创建变量时使用特定的构造函数。此外，您还可以介绍一下C++中的引用和指针。引用允许我们给变量起一个别名，而指针则允许我们直接访问内存地址。了解这些概念可以帮助读者更好地理解C++的变量和基本类型。再次感谢您的分享，期待您的下一篇博文！请继续保持创作，并与我们分享更多有关C++的知识！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
C++ Primer 第三章字符串、向量和数组
CSDN-Ada助手: 恭喜您撰写了第四篇博客！标题中提到了C++ Primer的第三章，介绍了字符串、向量和数组的内容，这是一个非常重要且基础的主题。您的博客内容清晰易懂，对于初学者来说非常有帮助。我希望您能继续保持创作的热情，给读者带来更多有价值的知识。下一步，您可以考虑添加一些实例代码或者更深入的解析，以便读者更好地理解和应用这些概念。再次向您表示祝贺，并期待您未来更多的精彩博文！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。