LSTM训练无法收敛

最新推荐文章于 2024-07-12 11:00:36 发布

置顶 weixin_40771875

最新推荐文章于 2024-07-12 11:00:36 发布

阅读量9.6k

点赞数 1

分类专栏：学习文章标签：人工智能智能交互深度学习 LSTM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40771875/article/details/88414335

版权

学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

LSTM不收敛问题

问题描述
我准备用LSTM建立一个关于时序数据的映射问题，简单点来说就是输入一段有序的数据，经过LSTM之后输出另一段有序的数据，例如输入一段行走的动画骨架数据，输出一段跑的骨架数据。
我的方法
使用了三层的LSTM,将走的数据当作输入，跑的数据当做标签，将网络输出的结果和我的标签数据进行对比（使用了MSE损失函数），然后反向传播改进网络。
我的问题
网络不收敛，损失函数下降到0.02左右就不下降了，如下图所示，数据量是够的，学习率也非常的小，0.00001，我是过加入batch normalize,没有什么效果，各位大神们有什么建议和经验之谈吗？望不吝赐教，谢谢大家了！！！

weixin_40771875

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
9
评论
LSTM训练无法收敛

LSTM不收敛问题问题描述我准备用LSTM建立一个关于时序数据的映射问题，简单点来说就是输入一段有序的数据，经过LSTM之后输出另一段有序的数据，例如输入一段行走的动画骨架数据，输出一段跑的骨架数据。我的方法使用了三层的LSTM,将走的数据当作输入，跑的数据当做标签，将网络输出的结果和我的标签数据进行对比（使用了MSE损失函数），然后反向传播改进网络。我的问题网络不收敛，损失函数下降...
复制链接

扫一扫

专栏目录

weixin_40771875 CSDN认证博客专家 CSDN认证企业博客

码龄7年

1: 原创

141万+: 周排名

44万+: 总排名

9664: 访问

: 等级

118: 积分

1: 粉丝

1: 获赞

9: 评论

1: 收藏

私信

关注

热门文章

LSTM训练无法收敛 9665

分类专栏

学习 1篇

最新评论

LSTM训练无法收敛
GOAT__CR7: 过拟合
LSTM训练无法收敛
皮皮虾_1: 可以请问一下遇到这种问题怎样解决吗，感觉训练什么都没学到就过拟合了
LSTM训练无法收敛
上班真难: 他这里误差小只是因为数据的数量级本身就小，只看绝对误差大小，没有什么意义
LSTM训练无法收敛
qq_40979204: 请问为什么误差小预测就不准呢。
LSTM训练无法收敛
青青啊: 请问你对这个误差的计算理解么为啥一开始就很小我也遇到过

大家在看

最新文章

目录

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。