RNN的5种典型结构

最新推荐文章于 2025-03-18 13:53:14 发布

ybdesire

最新推荐文章于 2025-03-18 13:53:14 发布

阅读量4.7k

点赞数 2

分类专栏： NLP Machine Learning 神经网络文章标签： RNN 自然语言处理神经网络数据挖掘深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ybdesire/article/details/104095916

版权

Machine Learning 同时被 3 个专栏收录

110 篇文章

订阅专栏

42 篇文章

订阅专栏

19 篇文章

订阅专栏

本文深入解析了RNN的五种典型结构：One-to-One、One-to-Many、Many-to-One、Many-to-Many(Tx=Ty)及Many-to-Many(Tx!=Ty)，并探讨了它们在序列模型如中文翻译英文、歌词生成、情绪识别等场景中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

引入

我已经在文章[1]中介绍了一些序列模型的应用，比如“中文翻译为英文”，“NER命名实体识别”，“歌词生成”，“情绪识别”。

也在文章[2]中介绍了RNN结构的基本原理。

那问题来了，要实现“中译英”和“歌词生成”，我们选用的RNN结构是一样的吗？RNN有哪些典型的结构，分别对应哪些应用场景呢？

RNN的5种典型结构

首先，直接给出RNN的5中典型结构，如下图。

在这里插入图片描述

然后我们依次讲解。

1. One to One

这是最简单的RNN结构，可以理解为输入一个单词（或词向量），输出一个单词（label）。

这种结构其实就是最普通的神经网络，和RNN其实没多大关系，写到这里也只是为了保持理论的完整性，实践中几乎没有这样用RNN的。

2. One to Many

可以理解为输入一个label，就能输出很多单词。

这样的应用比如“根据音乐类型（输入int型的一个x），生成一篇音乐”，或者“生成文章”。

当然这里有一个技术细节

当你生成序列时，通常会把第一个合成的输出，也喂给下一层
所以图中把第一个字符的输出y，作为了第二个字符的输入

3. Many to One

可以理解为，输入一篇文章，输出文章作者的情绪（0/1）。

这种“多对一”的结构，主要用于做“情绪识别”，或者“文章分类”。

4. Many to Many (Tx=Ty)

这就是[2]中介绍的最经典的RNN结构，这种结构的输入序列数量和输出序列数量相同，主要用于实现“NER命名实体识别”的应用。

Tx表示输入序列的长度，Ty表示输出序列的长度。

5. Many to Many (Tx!=Ty)

在某些情况中，比如做“中译英”，我们的输入中文汉字数量，和输出的英文单词数量不一样。就必须要实现输入输出不等长的RNN。

这样的RNN有两部分组成，左半部分叫做“Encoder”（编码器，获取输入），右半部分叫做“Decoder”（解码器）。

参考

[0]. AndrewNg的《序列模型》教程
[1]. https://blog.csdn.net/ybdesire/article/details/102963683
[2]. https://blog.csdn.net/ybdesire/article/details/103449597

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。