【Learning Notes】Quasi-recurrent Neural Networks

最新推荐文章于 2024-07-30 09:32:13 发布

MoussaTintin

最新推荐文章于 2024-07-30 09:32:13 发布

阅读量5.2k

点赞数

分类专栏：原创人工智能深度学习机器学习文章标签： CNN RNN QRNN 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jackytintin/article/details/77945354

版权

QRNN是一种结合RNN和CNN优点的神经网络结构，通过卷积操作替代循环，提高并行性和训练稳定性。在序列任务中，如情感分类、语言模型和机器翻译上表现出色，并在某些实现中相对于LSTM/GRU有速度优势。SRU是QRNN的一个特殊情况，具有简单的线性变换和highway连接，已在多个任务中取得优秀结果。

摘要由CSDN通过智能技术生成

QRNN [1] 是 Salesforce Research 团队（Update: 官方pytorch实现）提出的一种使用卷积操作替代传统的循环结构（vanilla RNN, LSTM, GRU）的新网络结构。QRNN 可以视为介于 RNN 和 CNN 之间的特殊结构。由于卷积操作没有循环结构时间上的依赖性，因此，QRNN 的计算并行度高；在训练时，卷积结构也要比循环结构更稳定。因此，QRNN 是一种潜在有用的网络，可以 drop-in 地替代各种 RNN。

笔者之前基于 Keras 写一个原型实现（见 github）。但不论学界还是工业界都对 QRNN 关注不多（大家倒是对 CNN 替代 LSTM/GRU 非常上心），最近发现一些比较详细的正向结果 [4]，因此，笔者觉得有必要更认真的对待 QRNN。

1. 动机

RNN 在计算时，有时间的依赖性，并行度受限；而 CNN 受制于有限的 receptive field，因此，信息传递太慢。QRNN 希望能综合RNN和CNN的优点，尽量避免各自的缺陷。

2. 算法

仿照 LSTM 的计算公式，QRNN 的各个门（gate）的计算公式如下：

Z = tanh (W z * X)

$\mathbf{Z} = \tanh(\mathbf{W}_z * \mathbf{X})$

F = σ (W

最低0.47元/天解锁文章

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。