最近研究了lstm后做的总结

关于lstm的结构是否可变:

    这个结构本身已经很好了,这个意思是你去小改小动无非是去调整lstm中各个部分的作用(只是调整)或是删去某个部分。但你在大致方向上不能做任何改动,这里比如为什么要先用短时那条线去更新长时那条线,而不是先更新短时的线,这个顺序是不能变的(但为什么我自己出个结构就不行呢,实际上你的结构这要在相同参数下结果相似,那已经很了不起了)。所以最后也就是加个peephole,调和遗忘门和输入门,或者改改出入口。


关于lstm的参数:

    每个门有一组权重和偏置,隐藏层和输出长度实际上作用不大,这个结构无论如何都是会收敛的,所以反倒是优化器得学习率是最重要的参数。


所以说以后不应该考虑通过调整lstm结构来获取学术成就,收益很小。


这里说明一下,lstm一般是跑序列的回归或是分类问题,但最终出结果时你需要跑很多个序列,不如把这些序列整合起来用cnn去跑,这样能掩饰单个序列预测上的不足。

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值