刘二大人PyTorch深度学习实践-13-RNN Classifier

最新推荐文章于 2023-10-21 23:14:28 发布

yuemo3353009

最新推荐文章于 2023-10-21 23:14:28 发布

阅读量1.4k

点赞数 14

分类专栏： PyTorch 文章标签：深度学习 pytorch

本文链接：https://blog.csdn.net/yuemo3353009/article/details/115770849

版权

本文基于刘二大人《PyTorch深度学习实践》介绍RNN Classifier，探讨如何预测名字所属的语言/国家。重点讲解双向RNN结构、PackedSequence的使用，以及训练过程中的实验结果分析，实验最佳accuracy约85%，关键epoch在15-25之间。

摘要由CSDN通过智能技术生成

引用自：刘二大人《PyTorch深度学习实践》

传送门：刘二大人《PyTorch深度学习实践》

传送门2：数据集

文章目录

`一、实现功能`

$\color {RED} {!!! \ 给出一个名字name，找到它对应的语言language/国家country}$

共有来自18种语言的names。预测一个name属于哪种语言/国家。

`二、模型整体架构`

`三、亿点点准备知识和实现细节`

`3.1 Bi-directional GRU/LSTM/RNN`

$\color {orange} {双向结构的RNN中:}$

$\color {orange} {最终hidden是由两个方向的第n个hidden拼接而成的}$

output, hidden = self.gru(gru_input, hidden)
if self.num_directions == 2:
    hidden_cat = torch.cat([hidden[-1], hidden[-2]], dim = 1) # GRU为双向时，hidden = [前向的第n个hidden, 反向的第n个hidden] 连接
else:
    hidden_cat = hidden[-1] # GRU为单向时，hidden = 前向的第n个hidden

`3.2 对输入的name的转置处理`

input = input.t()  # 将input shape由BatchSize * SeqLen -> SeqLen * BatchSize

`3.3 RNNClassifier类中forward()方法中的embedding`

$\color {green} {embedding的shape: (seqLen, batchSize, hiddenSize)}$

embedding = self.embedding(input)

`3.4 forward()方法中的pack_padded_sequence()方法`

$\color {tomato} {！！！新的重要知识点}$
使用前需要from torch.nn.utils.rnn import pack_padded_sequence
返回一个PackedSequence对象
第1个参数的shape:(seqLen, batchSize, hiddenSize)
第2个参数是一个tensor, 它是每个batch element的序列长度的列表

gru_input = pack_padded_sequence(embedding, seq_lengths)

最低0.47元/天解锁文章

yuemo3353009

关注

14
点赞
踩
25

收藏

觉得还不错? 一键收藏
2
评论
刘二大人PyTorch深度学习实践-13-RNN Classifier

引用自：刘二大人《PyTorch深度学习实践》传送门：刘二大人《PyTorch深度学习实践》文章目录`一、实现功能``二、模型整体架构``三、亿点点准备知识和实现细节``3.1 Bi-directional GRU/LSTM/RNN``3.2 对输入的name的转置处理``3.3 RNNClassifier类中forward()方法中的embedding``3.4 forward()方法中的pack_padded_sequence()方法``3.5 country_dict``3.6 对输入.
复制链接

扫一扫

专栏目录