深度学习的目标检测算法,通常会在输入图像中采样大量的区域,然后判断这些区域中是否包含我们感兴趣的目标,并调整(回归)区域边界,从而更准确地预测目标的真实边界框(ground-truth bounding box
)。
目标检测算法会需要做两个事情:
- 推荐区域框是否有目标
(positive or negative)
,是分类任务; - 调整这些区域框,不断逼近到目标真实框,是回归任务。
就针对目标检测算法的传统区域框推荐和深度学习的方法,问了chatGPT,他给出了下面的回答。给与我们借鉴,帮助我们理解。
传统的目标框推选方法,我们暂时就先不考虑。针对基于anchor
的方法,我们通过最常用的anchor based(anchor box)和anchor free
,和no anchor
来展开。
一、什么是Anchor
anchor
也叫做锚,预先设置目标可能存在的大概位置,然后再在这些预设边框的基础上进行精细化的调整。而它的本质就是为了解决标签分配的问题。
anchor
是如何生成的?锚作为一系列先验框信息&#