深度学习之Embedding

最新推荐文章于 2024-04-24 22:46:10 发布

向阳争渡

最新推荐文章于 2024-04-24 22:46:10 发布

阅读量991

点赞数

分类专栏： NLP 文章标签： pytorch

本文链接：https://blog.csdn.net/yangyang_yangqi/article/details/104902640

版权

NLP 专栏收录该内容

19 篇文章 0 订阅

订阅专栏

在深度学习模型中，Embedding层在代码层面上的意义是：一个保存了固定字典和大小的简单查找表。这个模块常用来保存词嵌入和用下标检索它们。模块的输入是一个下标的列表，输出是对应的词嵌入。

当输入是一个batch时，则这个输入矩阵是一个N维矩阵([batch_size,Seq_len]),输出矩阵([batch_size,Seq_len,embed_size])

PyTorch:

import torch
from torch import nn
from torch.autograd import Variable

embeds = nn.Embedding(20,5)
word_to_ix = {}
for i in range(20):
    word_to_ix[i] = i+1

hello_idx = torch.LongTensor([[3,6],[8,9]])
hello_idx = Variable(hello_idx)

embeds(hello_idx)

tensor([[[-0.7695,  0.1445, -0.7704, -0.6968,  0.1774],
         [-0.5415,  0.2232, -0.3729,  1.5091,  1.5055]],

        [[ 0.2723,  0.5890,  0.3809,  2.1650,  1.0792],
         [ 0.6174,  0.3788,  1.3872,  0.4625,  0.4803]]],
       grad_fn=<EmbeddingBackward>)


hello_idx = torch.LongTensor([[2,4]])
hello_idx = Variable(hello_idx)

embeds(hello_idx)

tensor([[[-0.7695,  0.1445, -0.7704, -0.6968,  0.1774],
         [-0.5415,  0.2232, -0.3729,  1.5091,  1.5055]]],
       grad_fn=<EmbeddingBackward>)

TensorFlow:

tf.nn.embedding_lookup()就是根据input_ids中的id，寻找embeddings中的第id行。比如input_ids=[1,3,5]，则找出embeddings中第1，3，5行，组成一个tensor返回。

embedded_words = tf.nn.embedding_lookup(embedding_w, self.inputs)

向阳争渡

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习之Embedding

在深度学习模型中，Embedding层在代码层面上的意义是：一个保存了固定字典和大小的简单查找表。这个模块常用来保存词嵌入和用下标检索它们。模块的输入是一个下标的列表，输出是对应的词嵌入。当输入是一个batch时，则这个输入矩阵是一个N维矩阵([batch_size,Seq_len]),输出矩阵([batch_size,Seq_len,embed_size])import torchf...
复制链接

扫一扫

专栏目录