cnn 回归 坐标 特征图_论文笔记 | CNN 是怎么学到图片绝对位置信息的

本文探讨了CNN如何在没有明确位置信息的情况下学到图片的绝对位置。通过实验发现,zero-padding在CNN中起到了关键作用,允许网络获取全局位置信息。尽管现有模型可以隐式学习位置,但仍有待深入挖掘如何更有效地利用这些信息。
摘要由CSDN通过智能技术生成

bd0b6374fc8db4b74c95de62f136b28c.gif

2832456945fec143dc1ac89912272187.png

来自 | 知乎 作者丨Xinlong Wang 来源丨https://zhuanlan.zhihu.com/p/99766566 编辑 | 深度学习这件小事 仅 作学术交流,如有侵权,请联系 删文

昨天读到一篇挺有意思的文章,已经被ICLR2020接收为Spotlight。这个工作解释了CNN是怎么学到图片内的绝对位置信息的。

https://openreview.net/forum?id=rJeB36NKvB

CNN和绝对位置,这两个概念很少被一起讨论。

我觉得有两个原因:一是,大家有一个默认的共识,CNN是平移不变的(对分类任务),或者说平移等变的(对分割和检测任务);二是,没有具体任务上的需求。比如对计算机视觉的三大物体感知任务,分类,分割和检测。物体分类跟位置没关系;语义分割作为像素级语义分类,也不依赖于位置;最有可能和绝对位置有关系的物体检测任务,被主流方法解耦了绝对位置,变成相对于锚框或者锚点进行局部

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值