提出一个CoDet方法,通过把区域-文字对齐问题重新组织为一个共生的目标发现问题,以克服对已经对齐好的视觉-语言空间的依赖性。
通过把具有相同概念的图像聚集在一起,具有相同概念的目标具有非常高的共生能力。CoDet能够利用视觉相似性,来发现共生目标,并与相同的概念进行对齐。
Align regions and words by co-occurrence:
提出一个CoDet方法,通过把区域-文字对齐问题重新组织为一个共生的目标发现问题,以克服对已经对齐好的视觉-语言空间的依赖性。
通过把具有相同概念的图像聚集在一起,具有相同概念的目标具有非常高的共生能力。CoDet能够利用视觉相似性,来发现共生目标,并与相同的概念进行对齐。
Align regions and words by co-occurrence: