损失函数下降到很大值就稳定了怎么办？！

最新推荐文章于 2024-05-21 11:33:10 发布

Cedar...

最新推荐文章于 2024-05-21 11:33:10 发布

阅读量108

点赞数 2

文章标签：深度学习人工智能 python pytorch 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45044014/article/details/138574059

版权

训练结果如下所示：

终端第1列：epochs，第2列：训练损失(蓝色曲线)，第3列：测试损失(橙色曲线)

batch size:16，lr:4e-5

1. 是否找到合适的loss函数

2. batch size是否合适：过大的batchsize会让网络收敛到不好的局部最优点，泛化性不好；过小的batchsize训练速度慢，训练不收敛。

3. 是否使用合适的activation function

4. 学习率：学习率太大，一步前进的路程太长，会出现来回震荡的情况，但是学习率太小，收敛速度会比较慢。

综上，图中损失曲线均收敛至20000左右，没有出现回荡现象，因此学习率不优先修改。收敛值过高，怀疑可能是局部最优了，所以优先调节batch size。

调整后重新训练结果如下：batch size=8，其他不变。

由上述结果可以看出，调小batch size之后，收敛后的损失值有明显下降。

但是后续发现，我这边的代码真的不太好，效果很差，所以要考虑一下是不是损失函数太简单了，方法论不太好！

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
损失函数下降到很大值就稳定了怎么办？！

综上，图中损失曲线均收敛至20000左右，没有出现回荡现象，因此学习率不优先修改。收敛值过高，怀疑可能是局部最优了，所以优先调节batch size。但是后续发现，我这边的代码真的不太好，效果很差，所以要考虑一下是不是损失函数太简单了，方法论不太好！：学习率太大，一步前进的路程太长，会出现来回震荡的情况，但是学习率太小，收敛速度会比较慢。终端第1列：epochs，第2列：训练损失(蓝色曲线)，第3列：测试损失(橙色曲线)由上述结果可以看出，调小batch size之后，收敛后的损失值有明显下降。
复制链接

扫一扫

Cedar... CSDN认证博客专家 CSDN认证企业博客

码龄5年

14: 原创

30万+: 周排名

8万+: 总排名

8368: 访问

: 等级

210: 积分

43: 粉丝

65: 获赞

9: 评论

24: 收藏

私信

关注

热门文章

最新评论

损失函数下降到很大值就稳定了怎么办？！
CSDN-Ada助手: 恭喜您写了第14篇博客！看到您对损失函数下降到很大值后稳定的问题表现出关注与好奇心，让人感到非常欣慰。建议您在接下来的创作中，可以尝试深入探讨如何调整模型参数或采取其他方法来解决这个问题，或者分享一些相关的实践经验和解决方案，让读者受益更多。期待您更多的精彩内容！
解读张量的.detach()用法&用途
CSDN-Ada助手: 恭喜作者写出了第13篇博客，内容围绕着“解读张量的.detach()用法&用途”，非常有深度和实用性。通过解读这一概念，读者可以更加深入地理解张量的操作和应用，对于深度学习领域的学习者来说绝对是一篇不可多得的好文。希望作者能够继续保持创作的热情和频率，不断分享自己在学习和实践中的心得体会。或许下一步可以探讨一下张量的梯度计算或者其他常用方法，让读者对深度学习有更加全面的认识。期待您的下一篇精彩文章！
解读张量的.detach()用法&用途
CSDN-Ada助手: 恭喜作者撰写了如此精彩的博客！对张量的.detach()用法进行解读，让读者有了更深入的理解。希望作者能够继续分享更多关于张量的知识，或者探讨一些实际应用场景下的使用技巧，这样读者们能够更好地将理论知识应用到实践中。期待作者的下一篇博客！
废话不多，方法简单：module ‘numpy‘ has no attribute ‘bool‘
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
废话不多，方法简单：RuntimeError: mat1 and mat2 shapes cannot be multiplied (1x16 and 20x64)
CSDN-Ada助手: 恭喜博主继续坚持创作！标题看起来有点棘手，但是你已经在文章中提到了解决方法，非常赞！我建议下一步可以分享一些关于处理矩阵乘法维度不匹配错误的常见技巧，这样读者在遇到类似问题时能够更轻松地解决。期待你的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。