Visual Relationship Detection with Language Priors

最新推荐文章于 2024-06-11 09:46:35 发布

EwanRenton

最新推荐文章于 2024-06-11 09:46:35 发布

阅读量5.5k

点赞数 1

分类专栏： paper

本文链接：https://blog.csdn.net/sinat_29963957/article/details/81256144

版权

《visual relationship detection with language priors》，这也是李飞飞在CNCC上提到的一片重要论文，发表于ECCV。此论文用来进行关系检测的主要方法是：分别训练两种视觉模型，一种来识别物体，一种来识别关系。关系识别的一个挑战在于没有足够的关系训练样本。比如说骑行这个动作，图片可能是人骑马、人骑车、人骑骆驼等等，想要将这些样本统统搜集起来是高耗能...

摘要由CSDN通过智能技术生成

《visual relationship detection with language priors》，这也是李飞飞在CNCC上提到的一片重要论文，发表于ECCV。
此论文用来进行关系检测的主要方法是：分别训练两种视觉模型，一种来识别物体，一种来识别关系。
关系识别的一个挑战在于没有足够的关系训练样本。比如说骑行这个动作，图片可能是人骑马、人骑车、人骑骆驼等等，想要将这些样本统统搜集起来是高耗能的。本论文在进行关系检测的同时，也证实了这种方法用于zero-shot detection的可能性。

1517557257206_2.png

由图可见此方法的大体流程是：输入图片，经过RCNN产生多个物体检测框，每个物体检测框分别经过视觉模型和语言模型进行打分，给定阈值将得分高于阈值的输出得到关系标签（person - riding - horse）

Training Approach

Visual Appearance Module

训练了一个CNN来对100个物体进行分类，同时训练了另一个CNN来对70个predicates进行分类。这里有实验表明，将每个objects predicates对分开进行训练得到的效果要比visual phrases’ detectors（将所有对一起训练）好。则视觉模型V如下：

最低0.47元/天解锁文章

EwanRenton

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
Visual Relationship Detection with Language Priors

《visual relationship detection with language priors》，这也是李飞飞在CNCC上提到的一片重要论文，发表于ECCV。此论文用来进行关系检测的主要方法是：分别训练两种视觉模型，一种来识别物体，一种来识别关系。关系识别的一个挑战在于没有足够的关系训练样本。比如说骑行这个动作，图片可能是人骑马、人骑车、人骑骆驼等等，想要将这些样本统统搜集起来是高耗能...
复制链接

扫一扫

专栏目录