MAF-YOLO: Multi-modal attention fusion based YOLO forpedestrian detection

MAF-YOLO:基于多模态注意力融合的行人检测YOLO

ABSTRACT

实现自然环境中行人的快速准确检测是人工智能系统的重要应用。然而,由于红外图像的低光密度和低分辨率,夜间行人的准确检测具有一定的挑战性,且对检测速度要求较高。提出一种基于多模态注意力融合YOLO (mafo -YOLO)的实时行人检测方法。首先,基于压缩的Darknet53框架构建多模态特征提取模块,以适应夜间行人检测,保证检测效率;从两种模式中提取特征,然后通过模态加权融合模块进行融合。其次,我们定义一个损失函数,并基于K-means聚类算法重新生成锚箱的大小,以提高小目标的检测速度和鲁棒性。最后,利用双注意模块从低分辨率的小目标中获取更多的语义特征。在KAIST和OSU的色热数据集上的实验结果证实了该方法的有效性。该方法也可用于其他行人检测算法。

 

 

 

 

 

1. Introduction

目标检测技术在计算机视觉中发挥着重要的基础性作用,因为它具有多种用途,如安全系统、目标跟踪、行人检测等。随着无人驾驶汽车的发展,行人检测已成为目标检测领域的关键问题。精确的行人检测算法可以提高无人驾驶技术的安全系数,保护驾驶员[1]。然而,在日常道路条件下,气候和照明变化会显著影响行人检测的准确性。此外,行人检测算法容易受到各种干扰的阻碍,例如低分辨率、遮挡或小目标检测,这导致检测精度低[2]。因此,如何在光照不足的情况下提高行人检测模型的鲁棒性是一个亟待解决的问题。迄今为止,人们从不同的角度提出了许多解决这一问题的方法。然而,大多数现有的方法倾向于在不以主要对象为目标的情况下处理提议区域包含的全部信息,这会在处理过程中产生许多不相关的信息。例如,在特征提取方面,各种背景信息可能会分散注意力。另一方面,目前的方法通常很难检测到小目标。因此,有效获取目标行人的特征仍然是一个尚未解决的问题;这主要是因为视觉信息在夜间情况下要复杂得多[3]。

即使在照明不足的情况下,红外热像仪也能获得图像的特征。它可以基于有限的可见光模式获取信息,使夜间行人检测成为可能[4]。然而,基于可见光的行人检测算法仍然表现得更好,因为在良好的光照条件下,红外光图像包含相对更多的次要特征信息。因此,近年来提出了大量基于红外和可见光多模式融合的行人检测算法。Hwang等人[5]提出了结合可见光和红外光模式的ACF+T+THOG(聚合通道特征+热+定向梯度热直方图)。实验结果表明,融合式行人检测器的性能优于单模态行人检测器。然而,由于采用传统方法,检测精度仍然有限。Wagner等人[6]利用深度卷积神经网络,提出了两种特征融合策略:早期融合和晚期融合。Liu等人[7]进一步讨论了基于深度卷积神经网络的可见光和红外图像的特征融合结构,提出了比早期融合和晚期融合更好的中间融合,再次提高了

  • 2
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
YOLO多模态融合可以采用不同的融合方式,包括前端融合、后端融合和中间融合。前端融合是指将多个模态的输入直接融合成一个输入,然后输入到YOLO模型进行处理。后端融合是指在YOLO模型的输出阶段将多个模态的结果进行融合。中间融合是指在YOLO模型的中间层将多个模态的特征进行融合。 以前的研究主要集中在前融合和中间融合的方法,而较少探索后融合的可能性。后融合的优点是可以更好地解释融合结果,因为它不依赖于深度学习模型的特征提取过程。然而,后融合也存在一些问题,如模态融合过程的不稳定性和模态之间的相干性。在使用后融合的方法时,需要考虑如何合理地进行融合和决策,以及如何解释融合结果。 总结起来,YOLO多模态融合可以采用前端融合、后端融合或中间融合的方式来实现。不同的融合方式有各自的优缺点,需要根据具体情况选择合适的方法。后融合方法可以提供更好的解释性,但也需要解决融合过程的不稳定性和模态之间的相干性等问题。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [ECCV2022 | 多模态融合检测新范式!基于概率集成实现多模态目标检测](https://blog.csdn.net/CV_Autobot/article/details/126756930)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 50%"] - *2* [工程(八)——yolov5可见光+红外双模态融合(代码)](https://blog.csdn.net/HUASHUDEYANJING/article/details/126275611)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值