LSTM:A SearchSpace Odyssey

最新推荐文章于 2022-06-24 15:20:24 发布

二丽莎白

最新推荐文章于 2022-06-24 15:20:24 发布

阅读量554

点赞数

分类专栏：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43960843/article/details/106722540

版权

该研究分析了语音识别、手写识别和复调音乐建模中8种LSTM变体，通过随机搜索优化超参数，发现遗忘门和输出激活功能是LSTM的关键。所有变体并未显著优于标准LSTM，且超参数相对独立，提供了调整指导。

摘要由CSDN通过智能技术生成

论文链接：http://www.jiqizhixin.com/wp-content/uploads/2015/11/5.-LSTM_-A-Search-Space-Odyssey-.pdf

摘要

本文首次对语音识别、手写识别和复调音乐建模这三个具有代表性的任务中的八个LSTM变体进行了大规模分析。使用随机搜索对每个任务的所有LSTM变体的超参数分别进行优化，并使用FANOVA框架评估其重要性。我们总结了5400次实验运行（约15年的CPU时间）的结果。
我们的结果表明，没有一种变体能够显著改善标准LSTM架构，并证明遗忘门和输出激活功能是其最关键的组成部分。我们进一步观察到，所研究的超参数实际上是独立的，并为它们的有效调整提供了指导。

在这里插入图片描述

Vanilla LSTM

它具有三个门（输入、忘记和输出）、块输入、单个单元（恒定误差旋转木马）、输出激活功能和窥视孔连接。块的输出反复连接到块输入和所有的门。下面给出香草LSTM层向前通道的矢量公式。
在这里插入图片描述
这里xt是t时刻的输入向量，W是矩形输入权重矩阵，R是平方递归权重矩阵，p是窥视孔权重向量，b是偏移向量。函数σ、g和h是点态非线性函数：logistic-sigmoid用作门的激活函数，双曲正切通常用作块的输入和输出激活函数。两个向量的逐点乘

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。