python交叉输出_解决pytorch 交叉熵损失输出为负数的问题

最新推荐文章于 2023-11-21 13:27:34 发布

weixin_39905725

最新推荐文章于 2023-11-21 13:27:34 发布

阅读量900

点赞数

文章标签： python交叉输出

网络训练中，loss曲线非常奇怪

交叉熵怎么会有负数。

经过排查，交叉熵不是有个负对数吗，当网络输出的概率是0-1时，正数。可当网络输出大于1的数，就有可能变成负数。

所以加上一行就行了

out1 = F.softmax(out1, dim=1)

补充知识：在pytorch框架下，训练model过程中，loss=nan问题时该怎么解决？

当我在UCF-101数据集训练alexnet时，epoch设为100，跑到三十多个epoch时，出现了loss=nan问题，当时是一脸懵逼，在查阅资料后，我通过减小学习率解决了问题，现总结一下出现这个问题的可能原因及解决方法：

1. 减小整体学习率。学习率比较大的时候，参数可能over shoot了，结果就是找不到极小值点；减小学习率可以让参数朝着极值点前进；

2. 改变网络宽度。有可能是网络后面的层参数更新异常，增加后面层的宽度试试；

3. 改变层的学习率。每个层都可以设置学习率，可以尝试减小后面层的学习率试试；

4. 数据归一化(减均值，除方差，或者加入normalization，例如BN、L2 norm等)；

5. 加入gradient clipping；

6 输入数据含有脏数据，即NaN,一般当使用实际业务的真实数据时，容易出现脏数据。

以上这篇解决pytorch 交叉熵损失输出为负数的问题就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持我们。

本文标题: 解决pytorch 交叉熵损失输出为负数的问题

本文地址: http://www.cppcns.com/jiaoben/python/324761.html

weixin_39905725

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python交叉输出_解决pytorch 交叉熵损失输出为负数的问题

网络训练中，loss曲线非常奇怪交叉熵怎么会有负数。经过排查，交叉熵不是有个负对数吗，当网络输出的概率是0-1时，正数。可当网络输出大于1的数，就有可能变成负数。所以加上一行就行了out1 = F.softmax(out1, dim=1)补充知识：在pytorch框架下，训练model过程中，loss=nan问题时该怎么解决？当我在UCF-101数据集训练alexnet时，epoch设为100，跑...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。