论文地址:
https://openaccess.thecvf.com/content_CVPR_2020/papers/Ulutan_VSGNet_Spatial_Attention_Network_for_Detecting_Human_Object_Interactions_Using_CVPR_2020_paper.pdf
代码地址:https://github.com/ASMIftekhar/VSGNet
研究内容
本文的研究主题是人物交互检测(HOI),包含对人,物的位置定位,交互判断,它是视觉场景理解,视觉问答,行为识别中任务的一部分,该任务目前的挑战:
(1)交互的通常以一种很细微的方式发生,同种交互在不同场景中可能存在很大的差异
(2) 一个人可以与多个物体发生交互,一个物体也可以与多个人发生交互
主要贡献
- 提出了一个空间注意力分支利用了人物对的空间结构,并优化了视觉特征,使得在空间上相关的人物对被加强了
- 使用图卷积分支,利用了人与物之间的结构联系,通过空间特征优化后的视觉特征来产生交互建议分数,用于定义人与物节点之间的边的强度
- VSGNet 包含了基于视觉,空间,图的分支,并形成了一个具有稳健性的管道.