深度学习入门--循环神经网络

最新推荐文章于 2022-11-13 20:44:57 发布

Tongji_joie

最新推荐文章于 2022-11-13 20:44:57 发布

阅读量456

点赞数 2

分类专栏：机器学习文章标签：深度学习 python

本文链接：https://blog.csdn.net/Tongji_joie/article/details/116144268

版权

本文介绍了深度学习中的循环神经网络（RNN）基础知识，通过一个实例展示了如何处理字符序列数据，包括数据预处理、模型构建、训练过程。强调了RNNCell与RNN的区别，以及独热向量的优缺点和解决方案，如使用Embedding进行数据降维。

摘要由CSDN通过智能技术生成

深度学习入门--循环神经网络

直接上例子：

题目： 构建一个RNN，使'hello'->'ohlol'

1. 总体思路：

由于’hello‘为字符串，不能构建为向量，因此需要进行一定处理，将字符与index关联。

将’hello‘将为[1,0,2,2,3]索引之后，还需要将其转换为独热向量，只有该位置上的数字为1，其余都为0.
独热向量的列数由字符的个数也就是索引的个数决定，图1.1 中共有4个字母，因此独热向量有4列！，（也就是inputsize！）
将最后独热向量作为RNN的输入，其中inputsize=4，由于字符串长度为5，所以，seq_len=5,包括（x1,x2,x3,x4,x5)

代表这每一个独热向量输入RNNcell，input_size=4，输入进网络
输出为一个多分类问题，在输入处理部分，将[e,h,l,o]=[0,1,2,3],输出为4维的向量，举例：o [0,0,0,1]

2. 准备数据，确定输入维度，input_size=4,seq_len=5,hiddensize=4,batch_size=1

input_size=4
hidden_size=4
batch_size=1

idx2char = ['e','h','l','o']
'hello'
x_data=[1,0,2,2,3]
'ohlol'
y_data=[3,1,2,3,2]

one_hot_lookup=[
    [1,0,0,0],
    [0,1,0,0],
    [0,0,1,0],
    [0,0,0,1]
]
#print(one_hot_lookup[2])
'矩阵为seq_len*inputsize'
x_one_hot=[one_hot_lookup[x] for x in x_data]

#print(x_one_hot)
'序列长度seq_len,batchsize，inputsize，'
inputs=torch.Tensor(x_one_hot).view(-1,batch_size,input_size)
#print(inputs)
'比较值'
'+vie(-1,1) 为最后输出分类情况对比，限制其为n行1列,seq_len*1'
labels=torch.LongTensor(y_data).view(-1,1)
#print(labels)

建立one_hot_lookup向量，用于建立输入独热向量，为seq_len*batch_size*inputsize
输出label同样，seq_len*1

最低0.47元/天解锁文章

Tongji_joie

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
深度学习入门--循环神经网络

深度学习入门--循环神经网络直接上例子：题目：构建一个RNN，使'hello'->'ohlol'1. 总体思路：由于’hello‘为字符串，不能构建为向量，因此需要进行一定处理，将字符与index关联。图1.1 字符转换过程将’hello‘将为[1,0,2,2,3]索引之后，还需要将其转换为独热向量，只有该位置上的数字为1，其余都为0. 独热向量的列数由字符的个数也就是索引的个数决定，图1.1 中共有4个字母，因此独热向量有4列！，（也就是input...
复制链接

扫一扫

专栏目录