题目:Unsupervised Object-Centric Learning From Multiple Unspecified Viewpoints
从多个未指定的角度进行无监督的以对象为中心的学习
作者:Jinyang Yuan; Tonglin Chen; Zhimeng Shen; Bin Li; Xiangyang Xue
摘要
视觉场景极其多样化,这不仅是因为物体和背景的无限可能组合,而且还因为同一场景的观察可能随着视点的变化而大不相同。当从多个视点观察多物体视觉场景时,人类能够从每个视点感知场景的组成,同时在不同视点之间实现所谓的“对象恒常性”,即使确切的视点未知。这种能力对于人类在移动中识别同一物体并高效地从视觉中学习至关重要。设计具有类似能力的模型是具有挑战性的。在本文中,我们考虑了一个新颖的问题,即在没有任何监督的情况下从多个未指定(即未知和不相关)的视点学习组合场景表示,并提出了一个深度生成模型,该模型将潜在表示分离成视点独立部分和视点依赖部分来解决这个问题。在推理过程中,潜在表示是随机初始化的,并通过集成不同视点中的信息与神经网络进行迭代更新。在几个特别设计的合成数据集上的实验表明&