LSTM:A SearchSpace Odyssey

该研究分析了语音识别、手写识别和复调音乐建模中8种LSTM变体,通过随机搜索优化超参数,发现遗忘门和输出激活功能是LSTM的关键。所有变体并未显著优于标准LSTM,且超参数相对独立,提供了调整指导。
摘要由CSDN通过智能技术生成

论文链接:http://www.jiqizhixin.com/wp-content/uploads/2015/11/5.-LSTM_-A-Search-Space-Odyssey-.pdf

摘要

  本文首次对语音识别、手写识别和复调音乐建模这三个具有代表性的任务中的八个LSTM变体进行了大规模分析。使用随机搜索对每个任务的所有LSTM变体的超参数分别进行优化,并使用FANOVA框架评估其重要性。我们总结了5400次实验运行(约15年的CPU时间)的结果。
  我们的结果表明,没有一种变体能够显著改善标准LSTM架构,并证明遗忘门和输出激活功能是其最关键的组成部分。我们进一步观察到,所研究的超参数实际上是独立的,并为它们的有效调整提供了指导。

在这里插入图片描述

Vanilla LSTM

  它具有三个门(输入、忘记和输出)、块输入、单个单元(恒定误差旋转木马)、输出激活功能和窥视孔连接。块的输出反复连接到块输入和所有的门。下面给出香草LSTM层向前通道的矢量公式。
在这里插入图片描述
  这里xt是t时刻的输入向量,W是矩形输入权重矩阵,R是平方递归权重矩阵,p是窥视孔权重向量,b是偏移向量。函数σ、g和h是点态非线性函数:logistic-sigmoid用作门的激活函数,双曲正切通常用作块的输入和输出激活函数。两个向量的逐点乘

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值