embedding_lookup,embedding_lookup_sparse,safe_embedding_lookup_sparse的使用

November丶Chopin

于 2021-10-05 11:50:34 发布

阅读量1k

点赞数 1

分类专栏：专栏07-TensorFlow&Keras 文章标签： tensorflow

本文链接：https://blog.csdn.net/u012762410/article/details/120606307

版权

专栏07-TensorFlow&Keras 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

embedding_lookup,embedding_lookup_sparse,safe_embedding_lookup_sparse的使用

1. 总结
2. embedding_lookup
3. embedding_lookup_sparse
4. safe_embedding_lookup_sparse

1. 总结

2. embedding_lookup

embedding_lookup有两个必选参数：params和ids，即返回ids指向的embedding。
embedding_lookup是三个lookup中最简单的一个，直接举例说明。

# 创建一个长度为4,维度为5的embedding矩阵
# array([[ 0,  1,  2,  3,  4],
#        [ 5,  6,  7,  8,  9],
#        [10, 11, 12, 13, 14],
#        [15, 16, 17, 18, 19]])
EmbMat = tf.constant(np.arange(20).reshape(4,5))
ids = [1,3] # 取出Emb中索引为1和3的embedding
emb = tf.nn.embedding_lookup(EmbMat, ids)
with tf.Session() as sess:
    emb_val = sess.run(emb)
# emb_val
# array([[ 5,  6,  7,  8,  9],
#        [15, 16, 17, 18, 19]])

3. embedding_lookup_sparse

3.1 tf.SparseTensor

构造SparseTensor需要传入三个参数：

dense_shape：SparseTensor的矩阵维度
indices：非0值所在的位置
values：indices中所表示的非0值位置的值

如：

SparseTensor(indices=[[0, 0], [1, 2]], values=[1, 2], dense_shape=[3, 4])

表示的稀疏矩阵为：

[[1, 0, 0, 0]
 [0, 0, 2, 0]
 [0, 0, 0, 0]]

3.2 embedding_lookup_sparse使用

# 创建一个长度为4,维度为5的embedding矩阵
# array([[ 0.,  1.,  2.,  3.,  4.],
#        [ 5.,  6.,  7.,  8.,  9.],
#        [10., 11., 12., 13., 14.],
#        [15., 16., 17., 18., 19.]])
EmbMat = tf.constant(np.arange(20).reshape(4,5).astype('f'))
# 创建SparseTensor
st = tf.SparseTensor(dense_shape=[3, 4],
                     indices=[[0, 1],[0, 2],
                              [1, 0],[1, 2],
                              [2, 3]],
                     values=[1,2,0,2,3])
# 根据稀疏向量SparseTensor,按照每一行取出embedding,并聚合(默认为mean)
emb = tf.nn.embedding_lookup_sparse(EmbMat, st, sp_weights=None)
with tf.Session() as sess:
    emb_val = sess.run(emb)
# emb_val
# array([[ 7.5,  8.5,  9.5, 10.5, 11.5],
#        [ 5. ,  6. ,  7. ,  8. ,  9. ],
#        [15. , 16. , 17. , 18. , 19. ]], dtype=float32)

3.3 稠密矩阵和稀疏矩阵之间的相互转换

此外，TF还提供了稀疏矩阵转换为稠密矩阵的函数：

3.3.1 稀疏矩阵转稠密矩阵

dt = tf.sparse_tensor_to_dense(st)
with tf.Session() as sess:
    val = sess.run(dt)

3.3.1 稠密矩阵转稀疏矩阵

def dense2sparse(dense):
    """
    稠密矩阵转稀疏矩阵
    tf.sparse_tensor_to_dense逆向操作
    dense: 稠密矩阵
    """
    where = tf.not_equal(dense, 0)
    indices = tf.where(where)
    values = tf.gather_nd(dense, indices)
    return tf.SparseTensor(indices, values, dense.shape)