神经网络训练不稳定问题（loss和accuracy波动大）的一种原因及解决方案

最新推荐文章于 2024-06-24 08:55:53 发布

JasmineFeng

最新推荐文章于 2024-06-24 08:55:53 发布

阅读量2.7w

点赞数 7

分类专栏：时间序列 PyTorch 文章标签：神经网络机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jasminefeng/article/details/113423113

版权

PyTorch 同时被 2 个专栏收录

14 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

本文探讨了使用LSTM进行时间序列预测时，批处理大小对模型训练过程（Loss和Accuracy）的影响。通过对比batchsize为2和4的情况，作者发现较小批量导致初期训练表现不稳定，而增大到4后损失和准确率波动减小，稳定性提升。关键发现集中在调整批量大小对模型收敛速度和精度的优化作用。

摘要由CSDN通过智能技术生成

用LSTM做时间序列预测时发现训练刚开始时loss（MSE）下降很快，accuracy（调整R方）上升也很快，但到后面loss总体上下降变慢，并且时有波动，accuracy甚至会经常出现负值，然后又回弹至正值。经查阅资料和反复调试，发现是batch size太小的问题，原来的batch size是2，现在改成4

batch size为2时loss的变化如下
在这里插入图片描述
batch size 为4时loss的变化如下，虽然也有波动，比如在910epoch左右loss冲到了0.06，但总体上比batch size稳定

再来看accuracy
batch size为2时accuracy变化如下，蓝色训练集，红色测试集

batch size为4时accuracy变化如下，确实更稳定了
在这里插入图片描述
参考资料：https://www.zhihu.com/question/30263116/answer/130163865

关注

7
点赞
踩
46

收藏

觉得还不错? 一键收藏
8
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 8

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。