锚框(anchor box)/先验框(prior bounding box)概念介绍及其生成

是苍啊！

已于 2022-04-17 17:29:21 修改

阅读量4.4w

点赞数 100

分类专栏：机器学习文章标签：机器学习计算机视觉

于 2020-12-19 23:32:43 首次发布

本文链接：https://blog.csdn.net/qq_46110834/article/details/111410923

版权

本文介绍了锚框（anchor box）或先验框（prior bounding box）在目标检测中的作用，包括其在特征图上的生成、与IOU的关系。详细讲解了尺度、宽高比参数，以及分类头和回归头的功能。通过维度分析阐述了不同尺度和宽高比组合下，分类头和回归头的输出维度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一.锚框(anchor box)/先验框(prior bounding box)

在众多经典的目标检测模型中，均有先验框的说法，有的paper(如Faster RCNN)中称之为anchor(锚点)，有的paper(如SSD)称之为prior bounding box(先验框)，实际上是一个概念，特此说明。

1.锚框的作用

对于目标检测任务，有这样一种经典解决方案：遍历输入图像上所有可能的像素框，然后选出正确的目标框，并对位置和大小进行调整就可以完成目标检测任务。这些进行预测的像素框就叫锚框。这些锚框通常都是方形的。

同时，为了增加任务成功的几率，通常会在同一位置设置不同宽高比的锚框（本文的方式在改变宽高比的同时维持面积不变）。此处注明，锚框的设置形式有很多，本文采用SSD的方式进行解释。

2.特征图中的锚框

如果按照上述方案不加改变的执行，即使是一张图片所产生的锚框将多到我们难以承受的地步。对于一个224x224的图片，假设每个位置设置3个不同尺寸的先验框，那么就有224x224x3=150528个锚框；这个数量太大了！所以，更好的处理方式是先对原图进行下采样处理，得到feature map，在feature map中生成锚框。以vgg16的backbone为例，把224x224的输入图片下采样了5次，得到7x7的feature map，那就只需要得到7x7x3=147个先验锚框，这样的设置大大减少了先验框的数量，同时也能覆盖大多数情况。

3.先验框与IOU

在训练任务阶段，可以在输入图片中插入正确的目标框，以供网络学习ground truth信息。而判断一个锚框是否与目标框相近的指标，很自然的可以选择锚框和目标框的IOU（交并比）。例如，可以设定一个阈值0.5，如果iou<0.5的先验框，这些框我们将其划分为背景，设为背景框，Iou>=0.5的被归到目标先验框。示例见下图

在这里插入图片描述