目标检测中的Anchor

前言:

在计算机视觉四大基本任务(检测、分类、定位、分割)中,图像的目标检测受到的了研究者们越来越多的关注。今天我们就来聊一聊在目标检测中一项重要的机制——Anchor。Anchor机制在凯明大神提出的Faster-RCNN(2015年提出)时兴起。下面将从三方面来叙述Anchor.

目录

1.什么是Anchor

2.Anchor的机制

3.Anchor的优缺点

1.什么是Anchor
在目标检测任务中,输入图像经过骨干网络提取得到特征图,该图上的每个像素点,即为anchor锚点;或者说在feature map使用滑动窗口的操作方式,当前滑窗的中心在原像素空间的映射点就称为Anchor;简单来说RPN(Reg ion Proposal Network)依靠一个在共享特征图上滑动的窗口,为每个位置(即:Anchor)生成9种预先设置好长宽比与面积的目标框。这9种初始anchor包含三种面积(128×128,256×256,512×512),每种面积又包含三种长宽比(1:1,1:2,2:1),即 Anchor boxes。示意图如下所示:
2.Anchor的机制
以每个anchor为中心点,人为设置不同的尺度(scale)和长宽比(aspect ratio),即可得到基于anchor的多个anchor box,用以框定图像中的目标,这就是所谓的anchor 机制。如下图所示,左侧显示了基于一个anchor点生成的9个anchor boxes(红、绿、蓝三种颜色),右侧显示了该特征图上密集分布的所有anchor boxes。
3.Anchor的优缺点
在知道了Anchor的原理和机制之后,下面我们就来讲讲Anchor的优缺点了:
 3.1 Anchor的优点:

 ① 使用anchor机制产生密集的anchor boxes,使得网络可直接在此基础上进行目标分类及边界框坐标回归;
 ② 密集的anchor boxes可有效提高网络目标召回能力,对于小目标检测来说提升非常明显。

 3.2 Anchor的缺点:

 ① anchor机制中,需要设定的超参:尺度(scale)和长宽比( aspect ratio)是比较难设计的。这需要较强的先验知识。
 ②冗余框非常之多:一张图像内的目标毕竟是有限的,基于每个anchor设定大量anchor boxes会产生大量的easy-sample,即完全不包含目标的背景框。这会造成正负样本严重不平衡问题,也是one-stage算法难以赶超two-stage算法的原因之一。
 ③网络实质上是看不见anchor boxes的,在anchor boxes的基础上进行边界回归更像是一种在范围比较小时候的强行记忆。

  • 13
    点赞
  • 74
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值