【论文阅读笔记】LSTM: A Search Space Odyssey

         本文是2017年发表在 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS上的一篇文章,文章通过大量的对比实验,揭示LSTM及其变种中各种结构单元对LSTM网络性能的影响,此处避免照原文翻译。文章通过改变LSTM输入门、输出门、遗忘门等网络单元,改变学习率、网络大小、高斯噪声、动量等超参数,以及组合改变来进行了多组实验,结论如下:

         1、没有任何变体可以显著地改进标准LSTM体系结构,但遗忘门和输出激活函数是其中最关键的组件。删除它们中的任何一个都会严重影响性能。输出激活函数可以防止无界的Cell State。GRU由于输入和忘记门的耦合,它的单元状态是有界的,在没有输出激活的情况下也可以很好地执行。

         2、各种超参数对网络性能的影响通常与具体的数据集有关。各种超参数的重要性从高到底排列:学习率、 网络规模、动量、噪声。          

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值