Anchor Box 学习笔记（一）

最新推荐文章于 2024-04-12 11:25:43 发布

Nirvana_Wei

最新推荐文章于 2024-04-12 11:25:43 发布

阅读量3.7k

点赞数 4

分类专栏： Visual Tracking 文章标签：计算机视觉

本文链接：https://blog.csdn.net/weibowen55/article/details/112504252

版权

本文介绍了Anchor Box在目标检测中的作用，它是一组预先定义的框，匹配数据集中物体的尺寸。 Anchor Box通过预定义的尺寸组合覆盖不同物体，优化了滑窗检测算法。文章详细阐述了Anchor Box的提出、匹配、损失计算等过程，并探讨了训练目标检测网络时的Ground Truth匹配和batch生成。

摘要由CSDN通过智能技术生成

Anchor Box 学习笔记（一）

what is an anchor box ?
How and where are anchor boxes proposed over an image?
When are anchor boxes proposed over an image?
Ground truth – matching anchors and generating batches
Anchor boxes and calculating detector losses – how are anchor boxes corrected during training

what is an anchor box ?

anchor box 是指在目标检测过程中，一组预先定义的框的集合，用来标识出被检测到的物体，其width和height 与数据集中物体的width 和 height 相匹配。这些预定义的anchor box的尺寸包含了数据集中所有可能被检测到的物体的尺寸组合，eg. 应该包括不同的ratio 和 scale。通常预先定义 4-10 个anchor box作为图像中各个位置的候选anchor box。

在计算机视觉领域中，深度神经网络在图像分类、目标检测领域表现出了卓越的性能。首先，滑窗检测器在前向传播过程中定位单个物体。后来，滑窗检测器被可以处理整个图像并输出多个检测结果的single-shot、 two-stage 检测器所取代。这些检测器很大程度上是基于anchor box 的概念来优化滑窗检测算法的速度和效率。这是因为滑窗检测器需要多次前向传播来处理图像，但大部分前向传播过程只处理了背景像素。
如图所示：
在这里插入图片描述
Figure 1: Sliding window detector

训练目标检测网络的典型任务包括提出anchor boxes 或者用传统computer vision 技术来搜索潜在的anchor。将一部分anchor boxes与 ground truth boxes 进行匹配，剩余未被匹配的anchors被当作背景处理，用这样的思路训练出正确的分类器。需要注意的是，预定义的anchor boxes可以理解为给卷积神经网络输出的feature map上的每一个点都预测固定数量的尺寸不一的boxes。