nips《tagger-deep-unsupervised-perceptual-grouping 》翻译





论文标题:Tagger: Deep Unsupervised Perceptual Grouping



作者:Klaus Greff, Antti Rasmus, Mathias Berglund, Tele Hotloo Hao,Jürgen Schmidhuber, Harri Valpola



【摘要】我们提出了一个有效的感知推理,它能明确地对输入和特征中的分割进行推论。我们的框架是以一种无监督方法或者有时会附加任意监督任务,来对分组过程进行学习,这与此前的为特定分区进行专门训练有很大的不同。我们让一个神经网络通过可微分机制,以迭代的方式将不同的物体表征进行分组。我们通过允许系统对各个分组和其中的表征的联合迭代推理进行分批次处理,实现了非常快速地收敛。与最近提出的一些用于解决多物体识别的方法不同,我们的系统不把输入看作是图像,因此能够直接处理其他的输入形态。我们使用多数位分类来评估方法,这种分类包含了非常复杂的图像,因而需要纹理分割的。通过使用分组机制,我们的方法提高了卷积网络的分类性能,尽管网络是被完全连接的。此外,我们还观察到,我们的系统大大改进了我们的数据集上的基础的阶梯网络的半监督结果。这些结果证明,分组是一种强大的工具,能够帮助提高抽样效率。

 

1.   引言

 

人类自然地认为世界是由不同的对象以及它们的属性和彼此之间的关系构造而成。这仲我们称为感知分组的现象在心理学中也称为模态感知。它毫不费力地发生并且包括视觉输入的分割,诸如图1中所示的,例如在解决鸡尾酒会问题(音频)中或当将抓握的物体的感觉与手指彼此接触(触觉)的感觉分离时。甚至更多抽象的特征,例如对象的类别,颜色,位置和速度被自然地与输入相干的目标分为一组。这种丰富的结构对于许多现实世界的任务是至关重要的,例如操纵物体或驾驶汽车,其中需要知道不同物体及其特征。

在本文中,我们介绍了一个框架,用于学习这种感知分组的有效迭代推理,我们称之为迭代平摊分组(TAG)。这个框架需要一种能够将输入和内部表示拆分成几个不同组的一种学习机制。我们不对这种分割的结构做假设,而是通过训练端到端的模型以便于发现哪些是相关特征以及如何执行分割。

通过使用辅助去噪任务,我们训练系统来直接摊销对象特征的后验推理及其分组。因为我们的框架没有对数据的结构做任何假设,它是完全域不可知的,适用于任何类型的数据。 TAG框架完全无监督地工作,但也可以与用于分类或分割的监督学习相结合。

2. Iterative Amortized Grouping (TAG)

Grouping

我们的目标是使神经网络将输入和内部表示分为相干组。我们将一起处理的输入和内部表示的集合定义为一个组,但(很大程度上)彼此独立。当在一个聚类中处理一切事情时可能出现干扰和模糊性,这里,我们通过分别处理每个组,使得网络可以利用不变的分布式特征,而没有干扰和模糊性的风险。对于对象和组之间的对应关系我们不做任何假设。如果网络可以在一个组中处理多个对象并且没有不必要的干扰,则

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值