目标检测论文解读复现之十二:基于注意力机制和上下文信息的目标检测算法

前言

此前出了目标改进算法专栏,但是对于应用于什么场景,需要什么改进方法对应与自己的应用场景有效果,并且多少改进点能发什么水平的文章,为解决大家的困惑,此系列文章旨在给大家解读最新目标检测算法论文,帮助大家解答疑惑。解读的系列文章,本人已进行创新点代码复现,有需要的朋友可关注私信我。

一、摘要

针对目标检测过程中存在小目标漏检问题,提出一种基于注意力机制和多尺度上下文信息的改进YOLOv5目标检测算法。首先,在特征提取结构中加入多尺度空洞可分离卷积模块(MDSCM)以提取多尺度特征信息,增大感受野的同时避免小目标信息的丢失;其次,在主干网络中添加注意力机制,并在通道信息中嵌入位置感知信息,进一步增强算法的特征表达能力;最后,使用Soft-NMS代替YOLOv5所使用的非极大值抑制(NMS),降低检测算法的漏检率。实验结果表明,改进算法在PASCAL VOC数据集、DOTA航拍数据集和DIOR光学遥感数据集中检测精度分别达到82.50%、71.90%和77.10%;相较于YOLOv5算法,精度分别提高了3.40个百分点、1.30个百分点和2.47个百分点,并对图像中小目标的检测效果更好。因此,改进的YOLOv5可以更好地应用到小目标检测场景中。

二、网络模型及核心创新点

1. 多尺度空洞可分离卷积模块

2. 注意力模块

3. Soft-NMS

4. 改进YOLOv5网络架构

三、应用数据集

为了验证本文所提出网络模型的性能,引入2007和2012的PASCAL VOC数据集、DOTA航拍图像数据集和DIOR遥感数据集进行分析。公共数据集VOC标注的数据有20类,为人、鸟、飞机、自行车等,共有21502张图像,其中测试集占训练集的1/4。

四、实验效果(部分展示)

1. 从下图中的可视化检测结果可以看出,AC-YOLO可以检测出原YOLOv5中漏检的飞机、储油罐等小尺寸目标,并且对于排列密集的目标的检测精度也高于YOLOv5。

2. 在DIOR光学遥感数据集中,AC-YOLO改进算法的m AP达到了77.10%,平均精度提升了2.47个百分点,在Airplane、Vehicle、Bridge、Expressway-toll-station(Ets)等小物体的检测精度上取得了不错的效果。可视化结果如下图所示。

五、实验结论

实验结果表明,优化后的YOLOv5算法在PASCAL VOC数据集上表现良好,尤其对于遥感图像中的小目标、密集目标等具有更好的检测效果,并在DOTA和DIOR两个遥感图像数据集上验证了本文模型的有效性和优越性。

六、投稿期刊介绍

注:论文原文出自刘辉,张琳玉,王复港,何如瑾.基于注意力机制和上下文信息的目标检测算法[J/OL].计算机应用.

https://kns.cnki.net/kcms/detail/51.1307.tp.20220704.0943.002.html

解读的系列文章,本人已进行创新点代码复现,有需要的朋友可关注下面公众号,私信我。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人工智能算法研究院

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值