循环神经网络学习笔记（基础篇）

最新推荐文章于 2023-03-04 11:42:20 发布

垃圾桶里也挺好

最新推荐文章于 2023-03-04 11:42:20 发布

阅读量463

点赞数

文章标签：学习深度学习 pytorch

本文链接：https://blog.csdn.net/maelee/article/details/125188563

版权

循环神经网络（RNN）基础篇学习笔记

一.权重共享

在CNN全连接层权重占比较多，在图像任务中，由于整个图像共享卷积核，所以实际参数量远远小于全连接层。
在这里插入图片描述
在实际任务中，由于全连接层参数过多，我们需要使用RNN解决带有序列模式的数据，同时利用权重共享的思想解决参数过多的问题。

二.RNN

1.序列模式的数据

比如预测天气时，今天的天气要依赖于上一天的天气数据，多用于天气、股票、自然语言处理等。
在这里插入图片描述

2.RNN Cell

h0：先验知识（可以初始化为全0与h1同维度的矩阵）
h1：hidden，与RNN Cell一同计算h2

在这里插入图片描述

RNN Cell本质就是一个线性层（Linear），hidden就是隐层，区别就是RNN Cell是共享的，反复参与运算。
RNN Cell详细运算如下：
在这里插入图片描述
伪代码实现：

直接使用RNN的话就不用自己实现循环：

Out为循环h1…hn，Hidden为最后一个隐层hn。

numlayer为几层的RNN（以下为numlayer详细图解）：
其中numlayer=3
在这里插入图片描述
直接使用RNN伪代码：

其他参数说明：

batch_first=True:数据的序列长度和样本数量进行交换，即batch_size与seq_len参数顺序交换。

4.嵌入层

独热编码缺点：
（1）维度过高（每个词映射后维度变成几万维，维度诅咒）
（2）稀疏
（3）硬编码
在这里插入图片描述
我们希望得到低维，稠密，学习到的编码。

由此引出嵌入层，实质上就是对数据进行降维。

在这里插入图片描述
此时网络结构（Embed嵌入层）变成：

伪代码：

5.练习

（1）RNN（RnnCell练习）

在这里插入图片描述
第一步：数据处理：使用独热编码

第二步：任务分析：输出为四维向量，通过交叉熵变为分布，实际上是分类问题。

代码如下：

import torch
import sklearn.preprocessing as sp

# 1. 数据准备
input_size = 4
hidden_size = 4
batch_size = 1
idx2char = ['e','h','l','o']
x_data = [[1],[0],[2],[2],[3]]
y_data = [[

最低0.47元/天解锁文章

垃圾桶里也挺好

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
循环神经网络学习笔记（基础篇）

在CNN全连接层权重占比较多，在图像任务中，由于整个图像共享卷积核，所以实际参数量远远小于全连接层。在实际任务中，由于全连接层参数过多，我们需要使用RNN解决带有序列模式的数据，同时利用权重共享的思想解决参数过多的问题。比如预测天气时，今天的天气要依赖于上一天的天气数据，多用于天气、股票、自然语言处理等。h0：先验知识（可以初始化为全0与h1同维度的矩阵）h1：hidden，与RNN Cell一同计算h2RNN Cell本质就是一个线性层（Linear），hidden就是隐层，区别就是RNN Cel
复制链接

扫一扫