pytorch二分类交叉熵的两种形式

最新推荐文章于 2024-05-13 23:20:43 发布

冬日and暖阳

最新推荐文章于 2024-05-13 23:20:43 发布

阅读量1.1k

点赞数 1

分类专栏： pytorch 文章标签： pytorch 深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29007291/article/details/120673921

版权

pytorch 专栏收录该内容

32 篇文章 1 订阅

订阅专栏

一、二分类交叉熵的两种计算接口

torch.nn.BCELoss和torch.nn.BCEWithLogitsLos

二、二者计算接口的区别

`torch.nn.BCELoss`

就是我们通常意义理解的二分类交叉熵的计算，并且提供了权重和维度的控制。 $w_n$ 表示权重控制。 $r e d u c t i o n$ 表示维度控制的方式。

$\ell(x, y) = L = \{l_1,\dots,l_N\}^\top, \quad l_n = - w_n \left[ y_n \cdot \log x_n + (1 - y_n) \cdot \log (1 - x_n) \right],$
$\ell(x, y) = \begin{cases} \operatorname{mean}(L), & \text{if reduction} = \text{'mean';}\\ \operatorname{sum}(L), & \text{if reduction} = \text{'sum'.} \end{cases}$

需要注意：
如果 $x_n$ 为0或1 ,PyTorch会设置 $log(0)=-\infty$ ，但是 $-\infty$ 在loss计算方程中是不可取的，原因如下

此时将会出现0×无穷大的情况
loss为无穷大，意味着梯度也无穷大，此时关于 $x_n$ 的反向传播将会导致非线性

因此，PyTorch在使用torch.nn.BCELoss 的时候，会将BCELoss的输出截断至大于等于-100。通过这个操作，可以获得有限的loss值以及线性的反向传播。

`torch.nn.BCEWithLogitsLos`

则是结合了Sigmoid和BELoss两个操作，但是并不是两个操作的简单结合。在结合的时候使用了 log-sum-exp 技巧获得了更好的数值计算稳定性

冬日and暖阳

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
pytorch二分类交叉熵的两种形式

一、二分类交叉熵的两种计算接口torch.nn.BCELoss和torch.nn.BCEWithLogitsLos二、二者计算接口的区别torch.nn.BCELoss就是我们通常意义理解的二分类交叉熵的计算，并且提供了权重和维度的控制。wnw_nwn表示权重控制。 reductionreductionreduction表示维度控制的方式。ℓ(x,y)=L={l1,…,lN}⊤,ln=−wn[yn⋅log⁡xn+(1−yn)⋅log⁡(1−xn)], \ell(x, y) = L = \{
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。