torch.nn.Embedding(num_embeddings, embedding_dim)的理解

最新推荐文章于 2025-03-18 20:03:11 发布

Victor_Gui

最新推荐文章于 2025-03-18 20:03:11 发布

阅读量1.4w

点赞数 24

分类专栏：机器学习笔记文章标签： pytorch

本文链接：https://blog.csdn.net/qq_31829611/article/details/90263794

版权

机器学习笔记专栏收录该内容

5 篇文章

订阅专栏

本文详细介绍了PyTorch中nn.Embedding函数的使用方法，通过实例演示如何创建词嵌入模型，解释了参数num_embeddings和embedding_dim的意义，并展示了词嵌入在实际应用中的效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

torch.nn.Embedding(num_embeddings, embedding_dim)

这个语句是创建一个词嵌入模型，num_embeddings代表一共有多少个词，embedding_dim代表你想要为每个词创建一个多少维的向量来表示它，直接上例子：

import torch
from torch import nn

embedding = nn.Embedding(5, 4) # 假定字典中只有5个词，词向量维度为4
word = [[1, 2, 3],
        [2, 3, 4]] # 每个数字代表一个词，例如 {'!':0,'how':1, 'are':2, 'you':3,  'ok':4}
         		   #而且这些数字的范围只能在0～4之间，因为上面定义了只有5个词
embed = embedding(torch.LongTensor(word))
print(embed) 
print(embed.size())

输出：

tensor([[[-0.4093, -1.0110,  0.6731,  0.0790],
         [-0.6557, -0.9846, -0.1647,  2.2633],
         [-0.5706, -1.1936, -0.2704,  0.0708]],

        [[-0.6557, -0.9846, -0.1647,  2.2633],
         [-0.5706, -1.1936, -0.2704,  0.0708],
         [ 0.2242, -0.5989,  0.4237,  2.2405]]], grad_fn=<EmbeddingBackward>)
torch.Size([2, 3, 4])

embed输出的维度是[2, 3, 4]，这就代表对于输入的[2,3]维的词，每一个词都被映射成了一个4维的向量。