Asymmetric Contextual Modulation for Infrared Small Target Detection
本文开源代码及单帧红外小目标检测数据集:
code:https://github.com/YimianDai/open-acm
sirst:https://github.com/YimianDai/sirst
427张短波、中波,950nm红外图像,5种标注方式 (a)类别标签 (b) 实例分割 © 边界框 (d) 语义分割 (e) 实例定位
模型驱动方法存在的缺点:
- 具有全局唯一显着性、稀疏性或高对比度的目标假设在现实世界图像中不成立。 真正的暗淡目标可能不显眼且对比度低,而许多背景干扰物满足这些假设,从而导致许多虚景(误报)。
- 许多超参数,对图像内容敏感且高度相关,这对于高度可变的场景不够稳健。
- 缺乏对整体场景的高层次理解,无法检测到极端暗淡的场景并去除显着的干扰因素。(需将高级上下文语义信息嵌入模型进行更好的检测)。
本文动机:
- 在红外小目标检测领域研究的深度学习方法很少。
- 缺乏公共数据集
- 缺少目标内在信息(SPIE将红外小目标定义为在256×256图像里具有小于 80 像素(9×9)的总空间范围)
- 深度网络即需要学习语义表示也需要兼顾细节特征
- 现有先进检测网络为通用图像数据设计,不适合直接用于红外小目标检测。需要进行以下改进:
- 重新定制下采样方案。(随着网络的加深,红外小目标的特征几乎无法保留。)
- 重新定制注意力模块。(现有的注意力模块倾向于聚合全局或远程上下文,潜在的假设是对象相对较大并且更全局地分布,全局注意力模块会削弱红外小目标的特征。)
- 重新定制特征融合方法。(小目标可能被深层背景,单向、自上而下的方式融合跨层特征可能不起作用。)
评价指标:
-
nIoU(the normalized Intersection over Union)
n I o U = 1 N ∑ i N T P [ i ] T [ i ]