目标检测论文精读一:One-Stage Cascade Refinement Networks for Infrared Small Target Detection 红外小目标检测的一级级联细化网络
1.有锚框和无锚框的区别与联系
有框的问题是需要调参,无框的问题是两点:
- 现有的基于中心的标签分配方法假设目标框内的正样本区域大于特征图步长平方,导致小目标可能无法覆盖任何特征点,从而被误标为背景。
- 红外小目标检测任务中,小目标的尺寸变化不大,但预测层的步长可能大于目标尺寸,导致漏检。
特点 | 有锚框 | 无锚框 |
---|---|---|
原理 | * 预先定义不同尺度和宽高比的锚框 * 通过计算预测框与锚框的 IoU 值来判断预测框是否为正样本或负样本 | * 直接对特征图上的每个位置进行分类和框回归 * 不需要预先定义锚框 |
优点 | * 易于理解和使用 * 可以根据目标尺度设计不同大小的锚框 | * 无需锚框设计,避免调参 * 检测精度受特征点分布影响 |
缺点 | * 锚框设计复杂,需要调参 * 易受目标尺度变化影响 | * 检测精度受特征点分布影响 |
2.ASPB 解决方案:
-
解耦目标尺寸与空间分配:
- 尺度分配: 将不同尺度的目标视为不同计算预算下的粗细近似,不再视为竞争关系,并将所有目标框视为正样本。
- 空间分配: 使用比真实框更大的假框来替代尺寸小于特征图步长的小目标的真实框,确保至少有一个特征点被标记为正样本。
-
假框生成:
- 对于尺寸大于假框尺寸的ground-truth box,直接使用真实框作为假框。
- 对于尺寸小于假框尺寸的ground-truth box,使用中心相同、尺寸为 p×p (p ≥ s) 的假框,其中 s 为特征图步长。
有锚框 | 无锚框 (例如 FCOS) | 自适应伪框 (ASPB) | |
---|---|---|---|
原理 | * 预先定义不同尺度和宽高比的锚框 * 通过计算预测框与锚框的 IoU 值来判断预测框是否为正样本或负样本 | * 直接对特征图上的每个位置进行分类和框回归 * 不需要预先定义锚框 |
|
区别 | / | 在一般的目标检测中,标签分配可分为尺度分配和空间分配。 * 尺度分配:将不同大小的目标按尺度分配到相应的特征金字塔水平进行检测 * 空间分配在所选水平上选择正样本位置(如FCOS中的中心采样)。 | 尺度分配:把所有目标盒视为正样本,按ground-truth的近似值由粗到细进行尺度分配 空间分配:引入一个具有相同中心和大小p ×p (p≥s)的伪盒替换尺寸小bounding box |
标签分配依据 | 锚框的位置和尺寸 | 特征点的位置和类别 | 伪框的位置和尺寸,ground-truth的近似值 |
尺度约束 | 锚框的尺寸预先定义,需要根据目标尺度进行调整 | 特征点的尺度与目标尺度无关 | 伪框的尺寸根据目标尺度自适应调整,无需额外约束 |
空间分配 | 基于锚框的网格进行采样 | 基于特征点的网格进行采样 | 基于伪框的网格进行采样,解耦空间分配和空间大小的问题 |
优缺点 | * 易于理解和使用 * 锚框设计复杂,需要调参 * 易受目标尺度变化影响 | * 无需锚框设计,避免调参 * 检测精度受特征点分布影响 | * 能够有效避免小目标被误标 * 可解决类别不平衡问题 * 可能引入低质量预测框 |
ASPB 标签分配方案是在无锚框标签分配的基础上,针对红外小目标的特点进行改进,通过引入伪框来放松尺度约束,并解耦空间分配与目标大小之间的关系,从而提高检测精度和鲁棒性。
优点:
- 减少目标漏检: 通过使用假框,确保所有目标都被标记为正样本,从而减少漏检。
- 缓解样本不平衡问题: 通过将更多特征点标记为正样本,缓解正负样本之间的不平衡问题。
- 提高检测性能: 实验结果表明,ASPB 能够有效提高红外小目标检测的 AP 值。
缺点:
- 假框尺寸的选择需要权衡漏检和误报之间的关系。过大的假框会导致误报增加,而过小的假框会导致漏检增加。
- ASPB 仍然存在一些局限性,例如无法解决所有的小目标检测问题,尤其是在复杂场景下。
2. 如何调整假框的尺寸以平衡漏检和误报?
1. 根据目标尺寸范围选择合适的 p:
- 平均尺寸: 如果目标尺寸范围较广,可以选择平均尺寸作为假框尺寸。
- 最大尺寸: 如果目标尺寸较小且相似,可以选择最大尺寸作为假框尺寸,以减少漏检。
- 动态调整: 可以根据目标尺寸范围和特征图步长动态调整假框尺寸,例如,随着特征图步长的增加而增加假框尺寸。
2. 使用经验法则:
- 一些研究表明,将假框尺寸设置为特征图步长的 1.5 倍可以获得较好的效果。
- 可以参考其他研究者的经验,选择合适的假框尺寸。
3. 通过实验确定最佳尺寸:
- 在训练集上使用不同的假框尺寸进行实验,并评估不同尺寸对漏检和误报的影响。
- 选择漏检和误报率都较低的最佳假框尺寸。
4. 考虑其他因素:
- 背景复杂度: 背景越复杂,误报的可能性越高,需要使用更大的假框来减少漏检。
- 特征图分辨率: 特征图分辨率越高,可以检测到更小的目标,可以使用更小的假框。
- 网络结构: 不同网络结构对假框尺寸的敏感性可能不同。
总结:
选择合适的假框尺寸需要综合考虑目标尺寸范围、特征图步长、背景复杂度、特征图分辨率和网络结构等因素。通过实验确定最佳假框尺寸是提高红外小目标检测性能的有效方法。