关于nn.embedding的中padding_idx的含义

最新推荐文章于 2025-03-14 15:30:01 发布

chnhbhndchngn

最新推荐文章于 2025-03-14 15:30:01 发布

阅读量9.8k

点赞数 12

分类专栏： torch 文章标签：自然语言处理 embedding padding

本文链接：https://blog.csdn.net/a857553315/article/details/107168428

版权

torch 专栏收录该内容

9 篇文章

订阅专栏

自然语言中使用批处理时候, 每个句子的长度并不一定是等长的, 这时候就需要对较短的句子进行padding, 填充的数据一般是0, 这个时候, 在进行词嵌入的时候就会进行相应的处理, nn.embedding会将填充的映射为0

其中padding_idx就是这个参数, 这里以3 为例, 也就是说补长句子的时候是以3padding的, 这个时候我们液晶padding_idx设为3

import torch
import torch.nn as nn

embed = nn.Embedding(10, 3, padding_idx=3) # padding_idx 默认是0
embed.weight

你会看到所以为3的向量为0, 让我们再举个栗子

x = torch.tensor([[2, 2, 3, 3], [1, 2, 5, 4]])
embed(x)

有两个句子, 长度是4, 但是第一个句子长度只有2, 另外其是由3来padding的, 这时候通过embedding我们可以看到:

映射后是0了,这样继续进行后续的计算了

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

chnhbhndchngn

关注关注

12
点赞
踩
15

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【Pytorch实用教程】nn.Embedding和nn.EmbeddingBag用法详解

若北辰

08-08

442

`nn.Embedding` 将索引映射到嵌入向量，适用于需要获取每个索引对应的嵌入向量的场景，如词嵌入；`nn.EmbeddingBag` 将多个索引的嵌入向量聚合（如求和或平均），适用于需要对多个嵌入向量进行聚合的场景，如词袋模型或 TF-IDF。

pytorch中nn.Embedding和nn.LSTM和nn.Linear

wangyangjingjing的博客

02-22

4630

CLASS torch.nn.Embedding(num_embeddings: int, embedding_dim: int, padding_idx: Optional[int] = None, max_norm: Optional[float] = None, norm_type: float = 2.0, scale_grad_by_freq: bool = False, sparse: bool = False, _weight: Optional[.

3 条评论您还未登录，请先登录后发表或查看评论

nn.Embedding中padding_idx的理解

FY_2018的博客

07-08

2550

每个句子的长度并不一定是等长的, 这时候就需要对较短的句子进行padding, nn.Embedding中padding_idx是指定padding的索引值。 #实例化词嵌入对象，序列进行padding时补padding_idx。当采用补0的方式，padding_idx =0 #这里的词空间大小为5，词嵌入维度大小为7 embeder = nn.Embedding(5,7,padding_idx=0) print(embeder.weight) #padding_idx的位置为全0 print('*.

【PyTorch】torch.nn.Embedding 类：单词或类别索引映射到高维向量表示

最新发布

彬彬侠的博客

03-14

317

torch.nn.Embedding是PyTorch中用于处理离散索引数据的嵌入层，通常用于自然语言处理（NLP）任务，以将单词或类别索引映射到高维向量表示。语法：torch.nn.Embedding(num_embeddings,embedding_dim,padding_idx=None,max_norm=None)。num_embeddings：词表大小（即嵌入矩阵的行数，表示多少个不同的索引）。embedding_dim：每个索引对应的嵌入向量维度。padding_idx：用于填充（padding）

torch.nn.Embedding()中的padding_idx参数解读

weixin_40426830的博客

09-29

9999

torch.nn.Embedding() Word Embedding 词嵌入，就是把一个词典，随机初始化映射为一个向量矩阵。列如：有一组词典，有两个词“hello”和“world”，对应的值为0和1.通过pytorch中的torch.nn.Embedding()建立一个2x10的向量矩阵，其中2表示词典中词的数量，10表示每个词对应的向量大小。 word_to_id = {'hello':0, 'world':1} embeds = nn.Embedding(2, 10) hello_idx = tor

【pytorch框架学习】nn.Embedding中的padding_idx用法示意

qq_42961603的博客

08-22

1887

import torch import torch.nn as nn embedding1 = nn.Embedding(10,3) embedding1.weight Parameter containing: tensor([[-0.9116, 0.5195, -1.3509], [ 0.5670, 0.8024, -0.0373], [-0.8223, -1.2181, -0.6713], [-1.2734, -1.0591, -1.1202],

Embedding之padding_idx学习

MyHeartWillGoOn

01-06

2874

文章目录题目解释举例case1:padding_idx=Nonecase2:padding_idx=0case3:padding_idx=3case4:padding_idx=3,将单词顺序变化题目 padding_idx学习解释 Embedding类参数含义 padding_idx (int, optional) If specified, the entries at :attr:padding_idx do not contribute to the gradient; th

Pytorch中的嵌入实例 nn.Embedding(max_type+3, args.features, padding_idx=0) 的解释

行子的博客

06-25

389

类的实例，可以作为神经网络中的一层使用。在网络的前向传播过程中，该层接收类型索引的张量作为输入，并将它们转换为对应的稠密嵌入向量。嵌入向量可以进一步由网络中的其他层进行处理。是一个 PyTorch 函数调用，用于创建神经网络模型的嵌入层。：这个参数指定了填充类型在词汇表中的索引。填充索引用于表示输入序列中的填充元素，的大小，或者数据集中唯一类型或标记的最大数量。词汇表中的每个类型或标记将被表示为一个具有。：这个参数确定了嵌入向量的大小，也就是。表示索引为 0 的类型被用作。个唯一类型，并且额外的。

def __init__(self, config): super(Model, self).__init__() if config.embedding_pretrained is not None: self.embedding = nn.Embedding.from_pretrained(config.embedding_pretrained, freeze=False) else: self.embedding = nn.Embedding(config.n_vocab, config.embed, padding_idx=config.n_vocab - 1) self.lstm = nn.LSTM(config.embed, config.hidden_size, config.num_layers, bidirectional=True, batch_first=True, dropout=config.dropout) self.fc = nn.Linear(config.hidden_size * 2, config.num_classes)

06-03

2. 根据config中的embedding_pretrained是否为None，选择使用预训练的词向量还是随机初始化的词向量。如果使用预训练的词向量，则调用nn.Embedding.from_pretrained()方法加载预训练的词向量，否则使用nn.Embedding...

self.embedding = nn.Embedding(config.n_vocab, config.embed, padding_idx=config.n_vocab - 1)

05-15

这行代码是用来定义一个embedding层的，其中config.n_vocab表示词表的大小，config.embed表示每个单词的embedding维度，padding_idx表示填充符的索引，一般情况下都是把填充符的索引设为词表的最后一个索引。...

nn.Embedding.from_pretrained

02-28

`nn.Embedding.from_pretrained` 是 PyTorch 中用于从预训练权重初始化嵌入层 (`Embedding`) 的一种方法。这在自然语言处理 (NLP) 领域非常有用，因为你可以利用已经学习好的词向量（如 GloVe 或 Word2Vec），而不是...

nn.Embedding 理解及其参数 padding_idx含义

Carl_changxin的博客

03-03

689

误区文章：https://blog.csdn.net/weixin_38257276/article/details/114195454。看到一些文章对Embedding层理解上存在误区，故贡献一点自己的想法。

nn.Embedding(num_embeddings, embedding_dim, padding_idx)

qq_43148788的博客

04-09

289

【代码】nn.Embedding(num_embeddings, embedding_dim, padding_idx)

深入理解padding_idx(nn.Embedding、nn.Embedding.from_pretrained）

qq_43391414的博客

03-23

4441

文章目录参数含义这个参数出现在一些地方，例如： nn.Embedding、nn.Embedding.from_pretrained。 import torch import torch.nn as nn import torch.optim as optim 参数含义如下： padding_idx (int, optional) – If specified, the entries at padding_idx do not contribute to the gradient; therefor

PyTorch 稀疏函数解析：embedding 、one_hot详解

CDBmax的博客

01-17

2134

本篇博客探讨了 PyTorch 框架中几个关键的稀疏函数，包括embedding和one_hot。这些函数在处理自然语言处理（NLP）任务和其他需要高效、灵活处理大量类别或序列数据的应用中至关重要。embedding函数用于从预定义的嵌入矩阵中检索指定索引的嵌入向量，支持自定义嵌入矩阵大小、填充索引和范数限制。提供了一种高效的方法来处理变长序列，通过聚合（如求和、均值或最大值）嵌入向量，而无需单独处理每个序列。one_hot。

nn.Embedding详解

001

02-16

837

是 PyTorch 中的一个模块，用于将离散的单词或标签等转换成一个固定大小的连续向量，通常在处理自然语言处理任务时用于单词的向量表示。创建了一个嵌入矩阵，每一行代表一个单词的向量。当索引通过嵌入层时，它会返回相应的词向量。包含了词汇表中的单词索引，

【python函数】torch.nn.Embedding函数用法图解

风巽·剑染春水的博客

09-20

9065

相比于One-hot编码，Embedding方式更方便计算，nn.embedding就相当于一个词典嵌入表。

nn.Embedding()详解、怎么将多句话转为vector的？

Drug discovery

03-27

1070

提到embedding_dim，就不得先从one_hot向量说起。最初的时候，人们将word转换位vector是利用one_hot向量来实现的。简单来讲，现在词典里一共5个字，[‘我’,‘是’,‘中’,‘国’,‘人’]，即num_embedding=5，而现在有一句话‘’，one_hot则利用一个长度为5的01 one_hot向量来代表这句话中的每个字【显然，这种方法简单快捷，但是当词典的字很多，比如50000个字的时候，这种方法会造成极大的稀疏性，不便于计算。

embedding 使用

weixin_42245626的博客

01-14

885

根据我遇到的情况来说首先要进行labelencoder 把每个不同的词变成变成从0开始的数字，torch.nn.embedding中的第一个参数就是数字个数。例如 i think i am a good student 一共6个不同的单词0-5 from sklearn.preprocessing import LabelEncoder s=['i' ,'think' ,'i' ,'am', 'a' ,'good' ,'student'] lbe = LabelEncoder() s=lb