【Pytorch】详解RNN网络中文本的pack和pad操作

最新推荐文章于 2024-06-29 11:02:13 发布

原创

最新推荐文章于 2024-06-29 11:02:13 发布 · 3.7k 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch #RNN

1. 引言

RNN模型一般设定固定的文本长度（text sequence length，可理解为文本序列在时间维度上的步数 time step），以保证网络输出层数据维度的一致性。但在训练和测试时，难以保证输入文本长度的一致性，因此常常需要截断操作（即将超过预设长度的文本截断）和pad操作（即对不足预设长度的文本进行补0填充）。pad操作需满足：
（1）pad后，不足预设长度的文本用相同特征维度的0填充；
（2）pad的部分不参与forward和backward计算。

Pytorch中，在文本数据的transfrom以及RNN网络的输入阶段，均充分考虑了pad操作。其主要体现在：
（1）RNN、LSTM和GRU等网络的输入数据均可为PackedSequence类型数据；
（2）可通过pad_sequence、pack_sequence、pack_padded_sequence和pad_packed_sequence等操作，实现pad和pack操作。

2. pack和pad操作

那么，究竟pad和pack操作对原始数据会有何影响？下面通过一个简单的示例来体现。

from torch.nn.utils.rnn import pack_sequence, pad_sequence,pad_packed_sequence, pack_padded_sequence, 

text1 = torch.tensor([1,2,3,4])    # 可视为有4个文字的样本
text2 = torch.tensor([5,6,7])  # 可视为有3个文字的样本
text3 = torch.tensor([8,9])    # 可视为有2个文字的样本
sequences = [text1, text2, text3]  # 三个文本序列

2.1 pack操作

[Input]  pack_sequence(sequences)
[Output] PackedSequence(data=tensor([1, 5, 8, 2, 6, 9, 3, 7, 4]), batch_sizes=tensor(

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

guofei_fly

关注关注

20
点赞
踩
21

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

自然语言处理之情感分析：使用循环神经网络(RNN)进行文本分类实战

zhubeibei168的博客

05-01

1121

序列模型是处理序列数据的机器学习模型，特别适用于自然语言处理中的任务，如情感分析、机器翻译和语音识别。在NLP中，序列模型可以捕捉文本中的顺序信息，这是理解语义的关键。循环神经网络长短时记忆网络门控循环单元情感分析（Sentiment Analysis），也称为意见挖掘（Opinion Mining），是自然语言处理（NLP）领域的一个重要分支，主要目标是从文本中识别、提取和量化作者的情感、态度或观点。

pytorch中的pack和pad操作

zly_Always_be的博客

04-09

2201

pytorch中的pack和pad操作

1 条评论您还未登录，请先登录后发表或查看评论

Pytorch之pack_padded_sequence与pad_packed_sequence函数

weixin_47187370的博客

03-19

353

因为专注于NLP的学习与研究，所以经常接触文本数据，文本数据有一个不好的地方是不同的文本的长度不同，而输入到模型中一个Batch的数据要求他们的长度是相同的，这就产生了要给文本加padding，使得一个Batch中所有的文本长度变成相同的，但pad不能参与到训练，这就给广大的炼丹师带来了麻烦，但幸好Pytorch给我们提供了两个函数pack_padded_sequence与pad_packed_sequence让我们很好的解决了这个问题。 import torch from torch.nn.utils.r

Pytorch学习之torch.nn.functional.pad()函数

热门推荐

tcn760的博客

05-26

1万+

torch.nn.utils.rnn.pad_sequence、torch.nn.utils.rnn.pack_padded_sequence和torch.nn.utils.rnn.pad_packed_sequence 在使用pytorch训练模型的时候，一般采用batch的形式同时处理多个样本序列，而同一batch中时序信息的的长度是不同的，这样就无法传入RNN，LSTM，GRU这样的模型中进行处理。一个常用的做法是按照一个指定的长度(或者按照batch中最长的序列长度)对batch中的序列进行填充(p

pytorch中 nn.utils.rnn.pack_padded_sequence和nn.utils.rnn.pad_packed_sequence

m0_46483236的博客

04-12

7284

1. 官方文档： torch.nn — PyTorch 1.11.0 documentation 2. 应用背景：在使用pytorch处理数据时，一般是采用batch的形式同时处理多个样本序列，而每个batch中的样本序列是不等长的，导致rnn无法处理。所以，通常的做法是先将每个batch按照最长的序列进行padding处理等长的形式。但padding操作会带来一个问题，那就是对于多数进行padding过的序列，会导致rnn对它的表示多了很多无用的字符，我们希望的是在最后一个有用的字符后就.

Pytorch-RNN关于pack_padded_sequence之enforce_sorted详解

Welcome to BierOne's blog!

04-25

2138

先说需求： input为一个batch，这个batch里由N个segment组成，这个segment的序列十分重要，不能打乱。因此，我不能把这个batch按照segment的长度，来从大到小进行排序但是我需要用LSTM来处理这个batch里面的每个segment 而且我还需要保证，LSTM处理之后，这个batch还是保持原来的segment序列解决方法：调用pack_padded_sequence来处理input，并且传入参数enforce_sorted=False 给出代码（一层的LSTM只需要

pytorch对可变长度序列的处理方法详解

09-19

本文将详细介绍PyTorch中用于处理变长序列的三个核心函数：`torch.nn.utils.rnn.PackedSequence()`、`torch.nn.utils.rnn.pack_padded_sequence()`以及`torch.nn.utils.rnn.pad_packed_sequence()`。 #### 一、`...

Pack and Pad

Utopia

01-15

转载： pack_padded_sequence 和 pad_packed_sequence - 知乎 PS：转侵删

pytorch 中pad函数toch.nn.functional.pad()的用法

09-18

今天小编就为大家分享一篇pytorch 中pad函数toch.nn.functional.pad()的用法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

pytorch的pack和unpack函数

仲夏

10-19

3377

pack unpack 导入 from torch.nn.utils.rnn import pack_padded_sequence as pack from torch.nn.utils.rnn import pad_packed_sequence as unpack 使用方法举例 embs = pack(self.embedding(inputs), lengths) outputs, ...

pytorch中RNN的pack_padded_sequence()和pad_packed_sequence()

rocking_struggling的博客

05-15

616

原文链接： https://www.cnblogs.com/sbj123456789/p/9834018.html 为什么有pad和pack操作？先看一个例子，这个batch中有5个sample 如果不用pack和pad操作会有一个问题，什么问题呢？比如上图，句子“Yes”只有一个单词，但是padding了多余的pad符号，这样会导致LSTM对它的表示通过了非常多无用的字符，这样得到的句子表示就会有误差，更直观的如下图：那么我们正确的做法应该是怎么样呢？在上面这个例子，我们想要得

RNN之pack_padded_sequence()和pad_packed_sequence()具体使用代码完整展现

believe__m的博客

09-12

412

RNN之pack_padded_sequence()和pad_packed_sequence()具体使用代码完整展现

torch.nn.utils.rnn.pad_packed_sequence()的注意事项

weixin_47187370的博客

03-20

446

跑程序时报错RuntimeError: shape ‘[4, 5, 50, 500]’ is invalid for input of size 450000，一看知道是维度不一致，发现是出现这torch.view()这里，再往下找发现出现在pad_packed_sequence()这里。很多讲解pytorch如何处理RNN变长padding的博客，但大家都没有提到一个问题，就是torch.nn.utils.rnn.pad_packed_sequence()的参数问题。(其实也不是啥大问题，只是大家没有提

pytorch笔记：PackedSequence对象送入RNN

qq_40206371的博客

11-01

1500

使用的主要好处是。因为通过跳过填充部分，RNN不需要在这些部分进行无用的计算。这特别对于处理长度差异很大的批量序列时很有帮助。

Pytorch中的RNN之pack_padded_sequence()和pad_packed_sequence()

qq_41970292的博客

10-25

903

为什么有pad和pack操作？先看一个例子，这个batch中有5个sample 如果不用pack和pad操作会有一个问题，什么问题呢？比如上图，句子“Yes”只有一个单词，但是padding了多余的pad符号，这样会导致LSTM对它的表示通过了非常多无用的字符，这样得到的句子表示就会有误差，更直观的如下图：那么我们正确的做法应该是怎么样呢？在上面这个例子，我们想要得到的表示仅仅是LSTM过...

Pytorch中的pack_padded_sequence与pad_packed_sequence

xhsun的博客

11-06

1020

这两个函数主要是用在RNN中处理变长序列的我们来看下面的例子： import torch inputs=torch.LongTensor([[1,2,0,0],[7,5,4,0],[9,0,0,0],[2,5,8,7]]) inputs_length=torch.LongTensor([2,3,1,4]) 其中inputs是我们假设的输入数据，值是0的位置代表该位置是pad的。 inputs_length是输入数据的实际长度。相当于说我们输入了4个句子，第一个句子长度为2，第二个句子长度为3，第三个句子

PyTorch LSTM情感分类：文本序列化与训练脚本详解

- 使用 `torch.nn.utils.rnn.pack_padded_sequence` 和 `torch.nn.utils.rnn.pad_packed_sequence` 对输入序列进行打包和拆包，处理不同长度的输入。 - 创建一个LSTM模型，可能包含一个嵌入层将词汇转换为向量，LSTM...