本周推荐《Multi-Label Image Recognition with Graph Convolutional Networks》,CVPR2019.
论文题目:基于图卷积网络的多标签图像识别模型
摘要:
旷视研究院提出一种基于图卷积网络(Graph Convolutional Network,GCN)的多标签分类模型。该模型通过 data-driven 方式建立标记间有向图(directed graph)并由 GCN 将类别标记映射(mapping)为对应类别分类器,提出使用 GCN 直接将词嵌入向量映射到一组互相依赖的分类器上,这些分类器进一步又可直接应用于图像特征以进行分类。
GCN 的模型有两个设计动机:
由于从词嵌入向量到分类器的映射参数在所有类别中是共享的,所以习得的分类器能够在词嵌入空间中(语义相关的概念在词嵌入空间中彼此临近)保留较弱的语义结构。与此同时,对于可以对标签依赖性进行隐式建模的分类器函数,所有分类器的梯度都会对它产生影响。
基于标签的共现模式,旷视研究员设计了一个全新的标签相关系数矩阵,可显式地用 GCN建模标签相关性,让节点的特征在更新时也能从相关联的节点(标签)吸收信息。
https://github.com/Megvii-Nanjing/ML-GCN