tf.nn.embedding_lookup函数的工作原理

最新推荐文章于 2023-11-16 10:21:46 发布

简之

最新推荐文章于 2023-11-16 10:21:46 发布

阅读量691

点赞数 1

分类专栏：深度学习文章标签： tensorflow embedding

本文链接：https://blog.csdn.net/olizxq/article/details/89737848

版权

深度学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

tf.nn.embedding_lookup函数的工作原理

函数定义：

tf.nn.embedding_lookup(
    params,
    ids,
    partition_strategy='mod',
    name=None,
    validate_indices=True,
    max_norm=None
)

官方解释：

This function is used to perform parallel lookups on the list of tensors in params，where params is interpreted as a partitioning of a large embedding tensor.

操作方式：

该函数按照ids顺序返回params中的第ids行。

实例解释：

在这里插入图片描述

如上例所示，输入数据为 $[0, 0, 0, 1, 0]$ ，对params执行乘法操作，由于输入是one hot 的原因， $x \cdot W$ 的矩阵乘法看起来就像是取了 $W$ 中对应的一行，看起来就像是在查表。这个实例中ids = 3，查表得到第四行数据 $[10, 12, 19]$ 。

实现过程：

针对输入是超高维向量，但是是one hot向量的一种特殊的全连接层的实现方法，其内部实际是包含一个网络结构的，如下图所示。

在这里插入图片描述

假设我们想要找到2的embedding值，这个值其实是输入层第二个神经元与embedding层连线的权重值。

使用该函数时，params给定的初始值是随机的，即全连接层的权值，但Embedding矩阵（params）会跟随网络中的其它参数一起训练，最终得到合适的Embedding向量，该过程可以类比word2vec学习词向量的过程，Embedding向量就是网络的副产品，即神经元与embedding层连线的权重值。