LSTM训练无法收敛

LSTM不收敛问题

  • 问题描述
    我准备用LSTM建立一个关于时序数据的映射问题,简单点来说就是输入一段有序的数据,经过LSTM之后输出另一段有序的数据,例如输入一段行走的动画骨架数据,输出一段跑的骨架数据。
  • 我的方法
    使用了三层的LSTM,将走的数据当作输入,跑的数据当做标签,将网络输出的结果和我的标签数据进行对比(使用了MSE损失函数),然后反向传播改进网络。
  • 我的问题
    网络不收敛,损失函数下降到0.02左右就不下降了,如下图所示,数据量是够的,学习率也非常的小,0.00001,我是过加入batch normalize,没有什么效果,各位大神们有什么建议和经验之谈吗?望不吝赐教,谢谢大家了!!!

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 9
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值