LSTM不收敛问题 问题描述 我准备用LSTM建立一个关于时序数据的映射问题,简单点来说就是输入一段有序的数据,经过LSTM之后输出另一段有序的数据,例如输入一段行走的动画骨架数据,输出一段跑的骨架数据。我的方法 使用了三层的LSTM,将走的数据当作输入,跑的数据当做标签,将网络输出的结果和我的标签数据进行对比(使用了MSE损失函数),然后反向传播改进网络。我的问题 网络不收敛,损失函数下降到0.02左右就不下降了,如下图所示,数据量是够的,学习率也非常的小,0.00001,我是过加入batch normalize,没有什么效果,各位大神们有什么建议和经验之谈吗?望不吝赐教,谢谢大家了!!!