动手学习深度学习（总结梳理）——22. 循环神经网络（RNN）

最新推荐文章于 2023-02-23 21:01:10 发布

TheFanXY

最新推荐文章于 2023-02-23 21:01:10 发布

阅读量488

点赞数

文章标签：深度学习学习 rnn

本文链接：https://blog.csdn.net/weixin_44981126/article/details/127474660

版权

1. 无隐状态的神经网络

2. 有隐状态的神经网络

import torch
from d2l import torch as d2l

X, W_xh = torch.normal(0, 1, (3, 1)), torch.normal(0, 1, (1, 4))
H, W_hh = torch.normal(0, 1, (3, 4)), torch.normal(0, 1, (4, 4))
torch.matmul(X, W_xh) + torch.matmul(H, W_hh)

现在，我们沿列（轴1）拼接矩阵X和H，沿行（轴0）拼接矩阵W_xh和W_hh。这两个拼接分别产生形状(3,5)和形状(5,4)的矩阵。再将这两个拼接的矩阵相乘，我们得到与上面相同形状(3,4)的输出矩阵。

torch.matmul(torch.cat((X, H), 1), torch.cat((W_xh, W_hh), 0))

3. 基于循环神经网络的字符级语言模型

4. 困惑度

5. QA

5.1 循环神经网络和递归神经网络是一个东西吗？如果不是有什么区别？

不是一个东西，递归我们没讲。递归和树神经网络很像，循环神经网络你可以理解是一个简单的递归神经网络。

5.2 中文需不需要分词，可否基于字来做？

数据量会大，英语一般用的是字根。后续会讲怎么实现的。

5.3 现在有没有什么vioce和image融合算法适合落地？

transformer现在在做那种多模态。落地要看场景，数据，以及具体的问题和场所。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

TheFanXY

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

深度学习系列资料总结

专注大数据与人工智能技术分享，欢迎私信加群互相学习！

07-17

2万+

说明本系列深度学习资料集合包含机器学习、深度学习等各系列教程，主要以计算机视觉资料为主，包括图像识别、分类、检测、分割等，内容参考Github及网络资源，仅供个人学习。深度学习定义一般是指通过训练多层网络结构对未知数据进行分类或回归深度学习分类有监督学习方法——深度前馈网络、卷积神经网络、循环神经网络等；无监督学习方法——深度信念网、深度玻尔兹曼机，深度自编码器等。手写机器学习笔记github机器学习算法公式推导以及numpy实现github人工智能相关术语link。..................

Keras深度学习实战（31）——构建电影推荐系统

盼小辉丶的博客

10-19

6127

参与评论您还未登录，请先登录后发表或查看评论

《动手学深度学习》 RNN & GRU & LSTM with gluon

weixin_42152526的博客

08-30

463

RNN 循环神经网络，时间步t的隐藏变量的计算由当前时间步的输入和上一个时间步的隐藏状态共同决定。 GRU 门控循环单元，引入了重置门和更新门的概念。重置门输出R与上一时间步的隐藏状态按元素乘法，产生候选隐藏状态，决定是否drop上一时间步的隐藏状态。更新们对上一步的隐藏状态以及候选隐藏状态做加权平均，产生当前时间步的隐藏状态。 LSTM 长短期记忆，引入输入门，遗忘门，输出门。记住有6个公...

《动手学深度学习》循环神经网络

李谦的博客

02-18

373

pytorch版循环神经网络实现 import torch import torch.nn as nn import time import math import sys def load_data_jay_lyrics(): """加载周杰伦歌词数据集""" with open('/Users/nick/Documents/dataset/jaychou_lyrics.tx...

动手学深度学习： 6.2 循环神经网络

qq_38888209的博客

08-05

158

6.2 循环神经网络上一节介绍的nn nHt+1的计算，并输入到当前时间步的全连接输出层。图6.1 含隐藏状态的循环神经网络 我们刚刚提到，隐藏状态中XtWxh+Ht−1WhhXtWxh+Ht−1Whh \boldsymbol{X}_t \boldsymbol{W}_{xh} + \boldsymbol{H}_{t-1} \boldsymbol{W}_{hh}Whh连结后的矩阵。接下来，我们用一个具体的例子来验证这一点。首先，我们构造矩阵X、W_xh、H和W_hh，它们的形状分

学习笔记——动手学深度学习（RNN，GRU，LSTM）

weixin_44790306的博客

10-31

2425

文章标题摘要1. RNN循环神经网络1.1 无隐藏状态的神经网络1.2 有隐藏状态的循环神经网络1.3 以文本数据集为例实现RNN预测模型1.3.1 读取数据1.3.2 独热编码（词）1.3.3 初始化RNN的模型参数1.3.4 定义RNN模型1.3.5 创建一个类来包装这些函数1.3.6 梯度裁剪1.3.7 预测（未训练先预测）1.3.8 开始训练1.4 简洁实现RNN文本预测模型2. 门控循环单元（GRU）2.1 重置门和更新门2.2 候选隐藏状态2.3 隐藏状态2.4 代码实现GRU模型2.4.

动手学习深度学习 | 语言模型和循环神经网络笔记

yuanCruise

02-13

480

0.文本处理整体概况 step1：对原始数据进行分词 step2：对分词后的数据进行去重编号，得到[词语to序号]的列表，和[序号to词语]的字典。将这两部分用作后续训练循环神经网络的数据集。 step3：通过一些采样方法对构建的数据集进行采样，得到训练的批次。常见的采样方法有随机采样和相邻采样。 step4：利用语言模型对上述的数据集进行训练，得到一个nlp模型。语言模型有n元语法模型，RNN模...

ActionRecognition——基于深度学习的动作识别综述

02-24

在特征提取阶段，深度学习模型将应用如卷积神经网络（CNN）来提取空间特征，以及循环神经网络（RNN）或长短期记忆网络（LSTM）等来提取时间特征。在动作建模阶段，模型通常会结合时空特征构建动作表示，以捕捉动作在...

学习笔记：深度学习（6）——基于深度学习的语言模型

Morganfs的博客

04-25

1539

预训练模型梳理：从NNLM到词嵌入、从ELMo到GPT&BERT，以及After GPT&BERT。

机器学习（二） 神经网络——多层感知机——反向传播

weixin_43165513的博客

02-27

1432

概述 深度学习的目的是找出已知经验的潜在规律。

李沐动手学深度学习V2-RNN循环神经网络从零实现

flyingluohaipeng的博客

06-24

2962

根据上篇博客介绍李沐动手学深度学习V2-RNN循环神经网络原理，来从头开始基于循环神经网络实现字符级语言模型，模型将在H.G.Wells的时光机器数据集上训练，首先读取数据集。 2. 独热编码(one-hot encoding) 在train_iter中，每个词元都表示为一个数字索引，将这些索引直接输入神经网络可能会使学习变得困难，我们通常将每个词元表示为更具表现力的特征向量，最简单的表示称为独热编码（one-hot encoding）。简言之，将每个索引映射为相互不同的单位向量：假设词表中不同词元

Pytorch_循环神经网络RNN

谢彦的技术博客

12-06

1254

RNN是Recurrent Neural Networks的缩写，即循环神经网络，它常用于解决序列问题。RNN有记忆功能，除了当前输入，还把上下文环境作为预测的依据。它常用于语音识别、翻译等场景之中。 RNN是序列模型的基础，尽管能够直接调用现成的RNN算法，但后续的复杂网络很多构建在RNN网络的基础之上，如Attention方法需要使用RNN的隐藏层数据。RNN的原理并不复杂，但由于其中包括循...

循环神经网络理论——【torch学习笔记】

诗酒趁年华。

06-07

386

递归神经网络的理论部分，为后续搭建RNN神经网络奠定理论基础

小白也能看懂的pytorch——线性回归

h_qiu的博客

02-19

773

本篇文章的服务对象是没有武力值也想和pytorch沾沾边的小白朋友们，主要的内容是对于经典代码的逐行解读，解读内容以注释的形式展示。

神经网络-常见函数、定义

qq_58466532的博客

12-13

5975

V1只含有__iter__，而没有__next__方法,V1.__iter__方法的返回值V2内含有__iter__和__next__方法。可迭代对象(类）——只含有__iter__方法，不含__next__方法，且__iter__方法返回的是一个迭代器对象；一般都是将迭代器类（对象）、可迭代类（对象）进行混合使用： IT（）是一个迭代器类，Foo（）是一个可迭代类，Foo()的__iter__方法返回的是一个迭代器对象IT。将矩阵y改变形状，这里（a，b）前面的数(a)表示行数，后面的数(b)表示列数。

深度学习与神经网络学习笔记(四)---线性回归

GodWeiJia的博客

08-10

1049

关于深度学习与神经网络的一些学习笔记

线性回归底层实现——【torch学习笔记】

诗酒趁年华。

04-11

934

从零开始的线性回归实现引用翻译：《动手学深度学习》与另一篇添加链接描述实现线性回归——【torch学习笔记】相对应，本篇更偏向于各函数的底层实现。在这一节中，以及接下来的类似章节中，将实现线性回归的所有部分。数据管道、模型、损失函数，和梯度下降优化器，从头开始。今天的深度学习框架可以自动完成几乎所有这些工作。但是，如果你从来没有学会从头开始实现这些东西。那么你可能永远不会真正理解模型的工作原理。此外，当需要定制模型的时候。定义我们自己的层、损失函数等等。知道事情在引擎盖下是如何工作的将会很有用。

【全网最详细】使用PyTorch实现循环神经网络