来自 | 知乎 作者丨Xinlong Wang 来源丨https://zhuanlan.zhihu.com/p/99766566 编辑 | 深度学习这件小事 仅 作学术交流,如有侵权,请联系 删文
昨天读到一篇挺有意思的文章,已经被ICLR2020接收为Spotlight。这个工作解释了CNN是怎么学到图片内的绝对位置信息的。
https://openreview.net/forum?id=rJeB36NKvB
CNN和绝对位置,这两个概念很少被一起讨论。
我觉得有两个原因:一是,大家有一个默认的共识,CNN是平移不变的(对分类任务),或者说平移等变的(对分割和检测任务);二是,没有具体任务上的需求。比如对计算机视觉的三大物体感知任务,分类,分割和检测。物体分类跟位置没关系;语义分割作为像素级语义分类,也不依赖于位置;最有可能和绝对位置有关系的物体检测任务,被主流方法解耦了绝对位置,变成相对于锚框或者锚点进行局部