查看embedding内容的方法

最新推荐文章于 2022-12-06 13:33:11 发布

sinat_40147910

最新推荐文章于 2022-12-06 13:33:11 发布

阅读量1.3k

点赞数

分类专栏：推荐系统

本文链接：https://blog.csdn.net/sinat_40147910/article/details/108541600

版权

本文介绍了在PyTorch中如何创建和使用embedding层。通过`nn.Embedding`可以自动学习词的权重，参数包括词个数和每个词的嵌入维度。若已有预训练权重，可使用`from_pretrained`加载。讲解了`Embedding.weight`属性及其尺寸。

摘要由CSDN通过智能技术生成

pytorch

需要学习权重: embeddings = nn.embedding(词个数,embedding_size)

预先知道权重/使用预训练权重 : embeddings = nn.embedding.from_pretrained(pre_weight)

nn.embedding(num_embeddings,embedding_dim) 可以自动学习每个词对应的权重

num_embeddings : 词嵌入字典大小，即我们的数据里有多少个词

embedding_dim : 每个词嵌入向量的大小,也就是代码里经常出现的embedding_size

Embedding.weight的大小是(num_embeddings,embedding_dim)

word_to_ix = {'hello': 0, 'world': 1}   # 论文里说的每个词先是one-hot表示
embeds = nn.Embedding(2, 5)  # [总共有多少个词,每个词的embedding_size]

hello_idx = torch.LongTensor([word_to_ix['hello']])  # 想要访问某个词的embedding

# 特别注意一下我们需要Variable，因为我们需要访问nn.Embedding里面定义的元素，并且word embeding算是神经网络里面的参数，所以我们需要定义Variable。
hello_idx = Variable(hello_idx) #  这里得到hello这个词的index

hello_embed = embeds(hello_idx)  # 得到初始词向量hello的embedding表示
print(hello_embed)

最低0.47元/天解锁文章

sinat_40147910

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
查看embedding内容的方法

pytorch需要学习权重: embeddings = nn.embedding(词个数,embedding_size)预先知道权重/使用预训练权重 : embeddings = nn.embedding.from_pretrained(pre_weight)nn.embedding(num_embeddings,embedding_dim) 可以自动学习每个词对应的权重num_embeddings : 词嵌入字典大小，即我们的数据里有多少个词embedding_dim : 每个词嵌..
复制链接

扫一扫