深度学习笔记（四十二）不同类型RNN结构以及语言模型和序列生成

Mr.zwX

于 2022-01-17 00:35:42 发布

阅读量860

点赞数 2

分类专栏：【深度学习/神经网络】Deep Learning 文章标签：深度学习语言模型 rnn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_16763983/article/details/122531402

版权

【深度学习/神经网络】Deep Learning 专栏收录该内容

85 篇文章 46 订阅

订阅专栏

一、不同类型的RNN

在这里插入图片描述
在序列化问题中，有很多类型，比如：输入输出等长，输入输出不等长，输出为整型值等等。那么就有不同的RNN结构来处理不同的问题，这里参考了一篇文章《The Unreasonable Effectiveness of Recurrent Neural Networks》。

多对多结构（输入长度 = 输出长度）
多对多结构（输入长度不等于输出长度）
Machine translation

从这里开始，就引入了编码器encoder和解码器decoder，在编码阶段输入，在解码阶段输出
多对一结构
比如读入评论文本“这部电影太催泪了”，给出整数评分1~5
一对一结构
这就是一个非常简单的结构了
一对多结构
Music generation

多种RNN网络结构的总结

二、语言模型和序列生成

在这里插入图片描述
语言模型就是计算每个序列出现的可能性大小，最终输出最接近的答案。

构建语言模型，首先需要有一个训练集，包含大量的英文文本，然后对文本进行标记（tokenize）。

在这里插入图片描述
我们拥有一个词库，然后对每个单词进行one-hot编码，注意句子结尾需要定义，用< EOS >来表示。如果出现的单词不在词库中，则统一用< UNK >表示。

然后构建RNN模型如下：
在这里插入图片描述
注意这是在训练，初始的输入为0向量，后面每一个时间步的输入都是前一个时间步的输出。
损失函数如下：

求概率的过程如下：

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
深度学习笔记（四十二）不同类型RNN结构以及语言模型和序列生成

一、不同类型的RNN在序列化问题中，有很多类型，比如：输入输出等长，输入输出不等长，输出为整型值等等。那么就有不同的RNN结构来处理不同的问题，这里参考了一篇文章《The Unreasonable Effectiveness of Recurrent Neural Networks》。多对多结构（输入长度 = 输出长度）多对多结构（输入长度不等于输出长度）Machine translation从这里开始，就引入了编码器encoder和解码器decoder，在编码阶段输入，在解码阶段
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Mr.zwX 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。