AEZSL (adaptive embedding ZSL)动态映射的ZSL。之前的论文在源域上学习一个视觉语义映射W,然后直接将这个矩阵用在目标域。本文考虑了不同类别视觉语义映射会有很大差异,为每一个类别都学习一个映射W。源域使用图片和标签,进行学习。目标域通过计算和源域每个类的相似性(余弦距离),然后加权求和得到视觉语义映射矩阵W。
这篇论文和AdaGraph有相似之处。AdaGraph是为每个源域学习一个分类器,构建一个源域和目标域的关系图,利用元数据计算源域和目标域的相似性,然后通过对源域的分类器参数进行加权求和得到目标域的分类器参数。
AEZSL用两个类别的语义向量的余弦距离计算语义相似性,AdaGraph用域的元数据的 e − d ( ϕ ( v 1 ) , ϕ ( v 2 ) ) ) e^{−d(ϕ(v1),ϕ(v2)))} e−d(ϕ(v1),ϕ(v2)))计算两个域的相关性。