From Red Wine to Red Tomato: Composition with Context

Ishan Misra ,Abhinav Gupta ,Martial Hebert
The Robotics Institute, Carnegie Mellon University
@CVPR2017

Introduction

作者指出在当前的识别或检索任务中,state of art的方法多采用了data driven approach,就是通过监督学习从成千上万的数据中对复杂的概念进行建模,而不是像人类本能的那样通过将简单的概念组合为复杂的概念.
但将复杂的概念视为简单概念的组合不可避免的遇到一对关系:复合性和语境性.
这里写图片描述
作者用上图意在说明对于属性的视觉表达要依赖于他对应的物体(语境),红色对于酒的组合与红色对于西红柿的组合是完全不同的.作者提出了一种组合概念的方式,使其符合相应的语境,并且对于未训练过的组合有着良好的泛化能力.

Approach

本文的目标是将数个简单的视觉概念组合为一个复杂的视觉概念作为输出.作者将训练过的分类器作为相应的视觉概念的表达,然后通过学习一个神经网络,将数个简单的视觉概念的表达(分类器)转换为一个复杂的视觉概念表达作为输出.不失一般性的,作者展示了对于两个分类器的组合实现.其中 Va V a 表示属性概念的集合, Vb V b 表示物体概念的集合, Vab V a b 表示组合而成的属性-物体复杂概念.这里假设 Va V a 包括了 M M 个概念,Vb包括了 N N 个概念,则Vab应该包含了 MN M ∗ N 个概念组合.假设用于训练的数据集中包括了属于 MN M ∗ N 个组合中的 K K 个.对于每一种概念集合(本文中是两个,属性和物体)都训练一个SVM分类器,并以此产生了M+N个权重向量,分别以 wa w a wb w b 表示.作者本想直接训练 wab w a b ,但由于 K K 远小于MN,以此训练SVM较为困难(缺数据),故作者希望通过 wa w a wb w b 直接学习得到 wab=T(wa,wb) w a b = T ( w a , w b ) .
这里写图片描述
这里作者不选用相应属性/物体的 feature作为输入,而是选择了对应的分类器的权重.对于 wa w a ,也就是属性分类器,他的维度应该是 DM D , M 维,其中 D D 对应了图像的feature维度,M对应了可能的属性分类个数.
T T 代表相应的Transform神经网络,由三个全连接层组成,输入为MD wa w a ND N , D wb w b ,输出为 D D 维?这里作者没有给出输出的分类器的全部维度,个人认为应该是MN,D维,对应生成的 wab w a b .与此同时一张大象图像通过CNN提取到 D D 维的feature,然后与wab做点乘再加上sigmoid激活函数,生成一个 MN M ∗ N 维度的概率向量.通过Loss

L(I,wa,wb)=ylog(p)+(1y)log(1p) L ( I , w a , w b ) = y l o g ( p ) + ( 1 − y ) l o g ( 1 − p )
的约束使得输出的概率向量仅在对应的(large,elephant)上概率较高,在其他位置概率较低.

Experiments

作者对比了几个Baseline,包括
Individual:不进行组合,仅仅使用 wa w a , wb w b 进行预测,并且只考虑最大的 p(a) p ( a ) p(b) p ( b ) .
Visual Product:不考虑语境只进行组合,认为 p(a,b)=p(a)p(b) p ( a , b ) = p ( a ) p ( b )
Label Embeddings:对label进行词义的映射而不是分类.
Label Embeddings Only Regression (LEOR): 相比LF修改了loss
Label Embeddings With Regression :前两者的结合
作者在MITStates上进行了测试,任务是预测训练集中从未出现过的(A,O)对.
这里写图片描述

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。
经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值