关系网络
关系网络由两个重要的函数组成:嵌入函数和关系函数。嵌入函数用于从输入中提取特征。如果输入是图像,那么可以使用卷积网络作为嵌入函数,它会提供图像的特征向量,如果输入是文本,那么可以使用LSTM网络获得文本的嵌入。
零样本学习中的关系网络
零样本学习场景中,每个类下都没有数据点,但会有元信息。元信息是关于每个类的属性的信息,元信息会被编码到语义向量Vc中,下标c表示类别。没有使用单一的嵌入函数来学习支撑集和查询集的嵌入,而是分别使用了两个不同的嵌入函数,使用第一个函数学习语义向量的嵌入,使用第二个函数学习查询集的嵌入,并使用拼接运算符拼接这些嵌入。
使用均方误差(MSE)作为损失函数。
使用TensorFlow构建关系网络
import tensorflow as tf
import numpy as np
# 随机为每个类生成1000个数据点
classA = np.random.rand(1000,18)
ClassB = np.random.rand(1000,18)
# 组合这些类创建数据集
data = np.vstack([classA, ClassB])
# 设置标签
label = np.vstack([np.ones((len(classA),1)),np.zeros((len(ClassB),1))])
# 为支撑集和查询集定义占位符
xi = tf.placeholder(tf.float32, [None, 9])
xj = tf.placeholder(tf.float32, [None, 9])
# 为标签y定义占位符
y = tf.placeholder(tf.float32, [None, 1])
def embedding_function(x):
#使用一个前馈网络作为嵌入函数
weights = tf.Variable(tf.truncated_normal([9,1]))
bias = tf.Variable(tf.truncated_normal([1]))
a = (tf.nn.xw_plus_b(x,weights,bias))
embeddings = tf.nn.relu(a)
return embeddings
f_xi = embedding_function(xi)
f_xj = embedding_function(xj)
#结合特征向量
Z = tf.concat([f_x