tf.nn.embedding_lookup()应用
在embedding_inputs=tf.nn.embedding_lookup(embedding,inputs_id)中,embedding通常指词向量,inputs_id通常指由位置值组成的输入序列,embedding_inputs通常指词向量表示的输入序列。
eg:
#向量维度
embedding_size =5
#id种类
category_num=5
#由位置值(id)构成的输入序列
inputs_id=[1,3,0]
#生成一个随机初始化的向量
embeddings=tf.Variable(tf.random_uniform([category_num,embedding_size],-1.0,1.0),dtype=tf.float32)
embedding_inputs=tf.nn.embedding_lookup(embeddings,inputs_id)
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
print('词向量列表')
print(sess.run(embeddings))
print('_______________________')
print('由词向量表示的输入序列')
print(sess.run(embedding_inputs))
outputs:
embedding原理:
对一个nxm维的矩阵M定义一个线性映射:x-->Mx。当x是一个标准基向量的时候,Mx对应矩阵中的一列,也就是对应id的向量表示。
eg:
x=[0 0 0 1 0]
id=Mx=[10 12 19]
引用:
https://blog.csdn.net/laolu1573/article/details/77170407