【摘 要】针对多光谱行人检测系统存在特征融合质量低、模型超参数多且锚框匹配算法复杂等问题,提出了一种基于差分特征注意力机制的无锚框多光谱行人检测算法。该算法首先采用差分特征感知融合方法挖掘多模态特征间的互补信息来优化通道特征;然后利用具有高效无锚框机制的CenterNet检测框架大大降低了模型计算复杂度,从而提升检测速度;最后引入差分特征注意力机制,改善特征融合质量,进一步提升检测精度。在KAIST、CVC14和FLIR这3个公开数据集上的实验结果表明,提出的算法和其他先进方法相比,能够同时有效提升检测精度和速度,具有较好的实际应用前景。
【关键词】多光谱行人检测 ; 无锚框机制 ; CenterNet模型 ; 注意力机制
1.引言
随着以深度学习为基础的人工智能技术的发展,我国正在全面布局与人工智能相关的产业,自动驾驶、城市大脑、智能监控等众多领域都成为当前比较火热的研究方向,而行人检测技术在这些领域中又具有重要的研究意义和应用价值。考虚到安全性和生产效率,行人检测算法应该具备精度高、速度快和延迟低等性能指标,并且应当具有极低的漏报率和误判率,而实际应用中检测设备面对的场景和气候等因素复杂多变,不同行人目标差异性较大,因此复杂场景下的行人检测是一个极具挑战性的研究课题。尤其在全天候应用场景中,行人检测算法应该对光照变化具有较强的鲁棒性,以适应不同的照明条件。
可见光图像和红外图像在白天和夜间各有优点,而多光谱行人检测提供了一种可以结合两种图像优点的解决方案。已有研究成果表明,多模态图像的行人检测结果明显优于单一模态图像,但仍然存在一些不足。首先,图像特征质量对检测性能具有重要影响,然而当前对特征级融合质量的研究相对较少ÿ