paddle：使用CrossEntropyLoss作为loss，训练时loss不下降？

我是一个对称矩阵

已于 2022-01-19 20:51:42 修改

阅读量3.2k

点赞数 5

分类专栏： paddlepaddle Debug专栏文章标签： paddle paddlepaddle 深度学习

于 2022-01-19 20:42:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40243750/article/details/122589348

版权

paddlepaddle 同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

8 篇文章 1 订阅

订阅专栏

0. 问题描述

做多分类任务时，使用了paddle的CrossEntropyLoss损失函数，但是在训练时，计算出的loss一直不变，如下图：
在这里插入图片描述

1. 解决

实际上很有可能你在定义网络模型时的最后一层输出层，加上了nn.Softmax()，只要将这个层注释掉，loss就可以正常下降了

2. 原因

CrossEntropyLoss:该OP计算输入input和标签label间的交叉熵损失，它结合了 LogSoftmax 和 NLLLoss 的OP计算，可用于训练一个 n 类分类器。

原因在于CrossEntropyLoss函数实际上内置了LogSoftmax 和 NLLLoss，也就是你一旦使用CrossEntropyLoss，在计算预测值和标签值时就会自动帮你将预测值给LogSoftmax 和 NLLLoss。

但当我们再在模型里最后一层加上Softmax，那就相当于输出值在模型里推理时，被Softmax一遍，当使用输出计算loss又被LogSoftmax 和 NLLLoss一遍，此时计算的loss就很小很小，导致没有梯度，故出现训练没用的效果。

3. 一些其他的原因

这些不是我遇到的，只是记录一下万一遇到了呢？
【黄埔学院】自定义loss函数，训练网络权值不更新 #28685

我是一个对称矩阵

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
paddle：使用CrossEntropyLoss作为loss，训练时loss不下降？

0. 问题描述做多分类任务时，使用了paddle的CrossEntropyLoss损失函数，但是在训练时，计算出的loss一直不变，如下图：1. 解决实际上很有可能你在定义网络模型时的最后一层输出层，加上了nn.Softmax()，只要将这个层注释掉，loss就可以正常下降了2. 原因原因在于CrossEntropyLoss函数实际上内置了Softmax，也就是你一旦使用CrossEntropyLoss，在计算预测值和标签值时就会自动帮你将预测值给Softmax。但当我们再在模型里最后一层加上
复制链接

扫一扫

专栏目录

我是一个对称矩阵 CSDN认证博客专家 CSDN认证企业博客

码龄7年

人工智能领域优质创作者

239: 原创

2369: 周排名

5837: 总排名

76万+: 访问

: 等级

4445: 积分

1万+: 粉丝

1007: 获赞

396: 评论

3744: 收藏

私信

关注

热门文章

分类专栏

最新评论

opencv-python(六)：颜色空间及转换
XH_160823113: 好吧，那只能用啥搜啥了
opencv-python(六)：颜色空间及转换
我是一个对称矩阵: 直接百度就行，其实都是一些颜色格式转换，都有很多文章介绍
使用ADB工具卸载/停用Android系统应用(无需Root)
z836454898: 提示没有 root 权限，无法禁用 Exception occurred while executing 'disable-user': java.lang.SecurityException: Cannot disable com.vivo.globalsearch no root permission at com.android.server.pm.PackageManagerService.setEnabledSettingInternalLocked(PackageManagerService.java:4573) at com.android.server.pm.PackageManagerService.setEnabledSettings(PackageManagerService.java:4477) at com.android.server.pm.PackageManagerService.-$$Nest$msetEnabledSettings(PackageManagerService.java:0) at com.android.server.pm.PackageManagerService$IPackageManagerImpl.setApplicationEnabledSetting(PackageManagerService.java:6362) at com.android.server.pm.PackageManagerShellCommand.runSetEnabledSetting(PackageManagerShellCommand.java:2572) at com.android.server.pm.PackageManagerShellCommand.onCommand(PackageManagerShellCommand.java:296) at com.android.modules.utils.BasicShellCo
LLM：Vicuna 7B模型简单部署体验
Dy&fff: 33f644f6-0b01-4883-b14c-1e539f03fc0e 已关注点赞收藏，博主求分享镜像，感谢！
Ubuntu安装CUDA出在三个cuda相关文件夹？
Unique流川: 你好我也遇见了一样的情况，在操作复制cudnn过程中发现没有对应文件夹，后来在一个target文件夹里发现了文件，真的好困惑……

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

我是一个对称矩阵 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。